Metodología CrUX

En esta sección, se documenta cómo CrUX recopila y organiza los datos de la experiencia del usuario.

Elegibilidad

En el núcleo del conjunto de datos de CrUX, se encuentran las experiencias del usuario individuales, que se agregan en distribuciones a nivel de página y de origen. En esta sección, se documentan la elegibilidad de los usuarios y los requisitos para que las páginas y los orígenes se incluyan en el conjunto de datos. Se deben cumplir todos los criterios de elegibilidad para que una experiencia se incluya en los datos a nivel de la página disponibles en PageSpeed Insights y la API de CrUX: Usuario, Origen y Página. Las experiencias que cumplen con los criterios de usuario y origen, pero no con páginas, no se incluyen en los datos a nivel de origen disponibles en todas las fuentes de datos de CrUX.

Las páginas y los orígenes se incluyen o quitan automáticamente del conjunto de datos si su elegibilidad cambia con el tiempo. En este momento, no puedes enviar de forma manual los orígenes o las páginas para que se incluyan.

Visible de manera pública

Una página debe ser visible públicamente para que se considere su inclusión en el conjunto de datos de CrUX.

Se determina que una página es visible públicamente con los mismos criterios de indexabilidad que los motores de búsqueda.

Una página no puede cumplir con el requisito de visibilidad si se cumple alguna de las siguientes condiciones, incluidas las páginas raíz del conjunto de datos de origen:

  • La página se entrega con un código de estado HTTP distinto de 200 (después de los redireccionamientos).
  • La página se entrega con un encabezado HTTP X-Robots-Tag: noindex o equivalente.
  • El documento incluye una metaetiqueta <meta name="robots" content="noindex"> o equivalente.

Consulta Google Search Console para obtener una descripción general del estado de indexación de tu sitio.

Suficientemente popular

Se determina que una página es lo suficientemente popular si tiene una cantidad mínima de visitantes. Se determina que un origen es lo suficientemente popular si tiene una cantidad mínima de visitantes en todas sus páginas. No se reveló un número exacto, pero se eligió para asegurarnos de tener suficientes muestras como para garantizar las distribuciones estadísticas de las páginas incluidas. La cantidad mínima es la misma para páginas y orígenes.

Las páginas y los orígenes que no cumplen con el umbral de popularidad no se incluyen en el conjunto de datos de CrUX.

Origen

Un origen representa un sitio web completo, al que se puede acceder mediante una URL como https://www.example.com. Para que un origen se incluya en el conjunto de datos de CrUX, debe cumplir con dos requisitos:

  1. Visible públicamente
  2. Suficientemente popular

Para verificar que tu origen sea detectable, ejecuta una auditoría de Lighthouse y observa los resultados de la categoría SEO. Tu sitio no será detectable si la página raíz no pasa las auditorías La página no puede indexarse o La página tiene errores en el código de estado HTTP.

Si se determina que un origen es visible públicamente, las experiencias del usuario aptas en todas sus páginas se agregan a nivel del origen, independientemente de la visibilidad de las páginas individuales. Todas estas experiencias cuentan para el requisito de popularidad del origen.

Para realizar consultas, ten en cuenta que todos los orígenes del conjunto de datos de CrUX están en minúscula.

Página

Los requisitos para que se incluya una página en el conjunto de datos de CrUX son los mismos que los orígenes:

  1. Visible públicamente
  2. Suficientemente popular

Para verificar que una página sea detectable, ejecuta una auditoría de Lighthouse y observa los resultados de la categoría SEO. Tu página no será detectable si falla las auditorías La página está bloqueada para la indexación o La página no tiene éxito en las auditorías de código de estado HTTP.

Si la página es detectable públicamente para algunos usuarios, pero muestra un estado HTTP no exitoso en algunas circunstancias, esas experiencias no se incluirán en CrUX.

Por lo general, las páginas tienen identificadores adicionales en su URL, incluidos los parámetros de cadena de consulta, como ?utm_medium=email, y fragmentos como #main. Estos identificadores se quitan de la URL en el conjunto de datos de CrUX para que todas las experiencias del usuario en la página se agreguen juntas. Esto es útil para páginas que, de lo contrario, no cumplirían con el umbral de popularidad si hubiera muchas variaciones inconexas de la URL para la misma página. Ten en cuenta que, en casos excepcionales, esto puede agrupar de forma inesperada experiencias de páginas distintas; por ejemplo, si los parámetros ?productID=101 y ?productID=102 representan páginas diferentes.

Las páginas de CrUX se miden en función de la página de nivel superior. Las páginas incluidas como iframes no se informan por separado en CrUX, pero sí contribuyen a las métricas de la página de nivel superior. Por ejemplo, si https://www.example.com/page.html incorpora https://www.example.com/frame.html en un iframe, entonces page.html aparecerá en CrUX (sujeto a los otros criterios de elegibilidad), pero frame.html no. Y si frame.html tiene un CLS deficiente, se incluirá el CLS cuando se mida el CLS para page.html. CrUX es el Informe sobre la experiencia del usuario en Chrome y es posible que los usuarios ni siquiera sepan que se trata de un iframe. Por lo tanto, la experiencia se mide en la página de nivel superior, según cómo la ve el usuario.

La arquitectura de un sitio web puede complicar la forma en que se representan sus datos en CrUX. Por ejemplo, las aplicaciones de una sola página (SPA) pueden usar un esquema de transición de ruta basado en JavaScript para moverse entre páginas, en lugar de las navegaciones de páginas convencionales basadas en anclas. Estas transiciones aparecen como nuevas vistas de página para el usuario, pero a Chrome y a las APIs de la plataforma subyacentes se atribuye toda la experiencia a la vista de página inicial. Esta es una limitación de las APIs de la plataforma web en las que se compila CrUX. Consulta Cómo las arquitecturas SPA afectan las Métricas web esenciales en web.dev para obtener más información.

Usuario

Para que sus experiencias se agreguen al conjunto de datos de CrUX, los usuarios deben cumplir con los siguientes criterios:

  1. Habilita los informes estadísticos de uso.
  2. Sincronizar su historial del navegador
  3. No tener configurada una frase de contraseña de sincronización.
  4. Usa una plataforma compatible.

Las plataformas que se admiten actualmente son las siguientes:

  • Versiones de Chrome para computadoras, incluidos los sistemas operativos Windows, macOS, ChromeOS y Linux
  • Versiones de Chrome para Android, incluidas las apps para dispositivos móviles que usan pestañas personalizadas y WebAPKs

Hay algunas excepciones notables que no proporcionan datos al conjunto de datos de CrUX:

  • Chrome en iOS.
  • Apps para Android que usen WebView.
  • Otros navegadores Chromium (por ejemplo, Microsoft Edge)

Chrome no publica datos sobre las proporciones de usuarios que cumplen con estos criterios. Puedes obtener más información sobre los datos que recopilamos en el Informe de privacidad de Chrome.

Accelerated Mobile Pages (AMP)

Las páginas creadas con AMP se incluyen en el conjunto de datos de CrUX como cualquier otra página web. A partir de la versión de CrUX de junio de 2020, las páginas publicadas con la Caché de AMP o renderizadas en el Visor de AMP también se capturan y se atribuyen a la URL de la página del publicador.

Calidad de los datos

Los datos en CrUX se someten a una pequeña cantidad de procesamiento para garantizar que sean estadísticamente precisos, estén bien estructurados y sean más fáciles de consultar.

Filtros

El conjunto de datos de CrUX se filtra para garantizar que los datos presentados sean estadísticamente válidos. Esto puede excluir orígenes o páginas completas para que no aparezcan en el conjunto de datos.

Además de los criterios de elegibilidad que se aplican a los orígenes y las páginas, se aplican filtros adicionales para los segmentos dentro de los datos:

Se excluyen por completo del conjunto de datos los orígenes o las páginas que tienen más del 20% de su tráfico total excluido debido a combinaciones de dimensiones no aptas.

Debido a que el conjunto de datos de nivel global abarca experiencias del usuario de todos los países, es posible que las combinaciones de dimensiones que no cumplan con los criterios de popularidad a nivel de país aún se incluyan a nivel global, siempre que la popularidad sea suficiente.

Fuzzing

Se aplica un poco de aleatoriedad al conjunto de datos para evitar que se aplique ingeniería inversa a los datos sensibles, como los volúmenes de tráfico total. Esto no afecta la precisión de las estadísticas agregadas.

Precisión

La mayoría de los valores de las métricas dentro del conjunto de datos de CrUX se representan como histogramas de valores y tamaños de discretización, en los que el valor del histograma es una fracción de todos los segmentos incluidos que se suman a 1. Los tamaños de los contenedores son números de punto flotante entre 1.0 y 0.0001.

Los anchos de los intervalos de los histogramas están normalizados para simplificar la consulta y la visualización de los datos. Esto significa que los discretizaciones más grandes se pueden dividir en discretizaciones más pequeñas, que comparten de forma equitativa la densidad original para mantener un ancho de discretización coherente.

Licencia

Los conjuntos de datos CrUX de Google cuentan con una licencia internacional de Creative Commons Attribution 4.0.