Méthodologie CrUX

Cette section explique comment CrUX collecte et organise les données sur l'expérience utilisateur.

Éligibilité

Au cœur de l'ensemble de données CrUX se trouvent les expériences utilisateur individuelles, qui sont agrégées en distributions au niveau de la page et de l'origine. Cette section décrit l'éligibilité des utilisateurs et les exigences concernant les pages et les origines à inclure dans l'ensemble de données. Pour qu'une expérience soit incluse dans les données au niveau de la page disponibles dans PageSpeed Insights et l'API CrUX, tous les critères d'éligibilité doivent être remplis : Utilisateur, Origine et Page. Les expériences qui répondent aux critères "Utilisateur" et "Origine", mais pas à celui de "Page", ne sont pas incluses dans les données au niveau de l'origine disponibles dans toutes les sources de données CrUX.

Les pages et les origines sont automatiquement incluses ou supprimées de l'ensemble de données si leur éligibilité change au fil du temps. Pour le moment, vous ne pouvez pas envoyer manuellement des pages ni des origines pour qu'elles soient incluses.

Visible publiquement

Pour qu'une page puisse être incluse dans l'ensemble de données CrUX, elle doit être accessible au public.

Une page est considérée comme publiquement accessible si elle répond aux mêmes critères d'indexabilité que les moteurs de recherche.

Une page ne peut pas répondre à l'exigence de détectabilité si l'une des conditions suivantes est remplie, y compris les pages racine de l'ensemble de données d'origine :

  • La page est diffusée avec un code d'état HTTP autre que 200 (après les redirections).
  • La page est diffusée avec un en-tête HTTP X-Robots-Tag: noindex ou un en-tête équivalent.
  • Le document inclut une <meta name="robots" content="noindex"> balise meta ou un élément équivalent.

Consultez la Google Search Console pour obtenir un aperçu de l'état d'indexation de votre site.

Suffisamment populaire

Une page est considérée comme suffisamment populaire si elle compte un nombre minimal de visiteurs. Une origine est considérée comme suffisamment populaire si elle compte un nombre minimal de visiteurs sur l'ensemble de ses pages. Nous ne divulguons pas le nombre exact, mais il a été choisi pour nous assurer d'avoir suffisamment d'échantillons pour être confiants dans les distributions statistiques des pages incluses. Le nombre minimal est le même pour les pages et les origines.

Les pages et les origines qui ne répondent pas au seuil de popularité ne sont pas incluses dans l'ensemble de données CrUX.

Origine

Une origine représente un site Web entier, accessible par une URL telle que https://www.example.com. Pour qu'une origine soit incluse dans l'ensemble de données CrUX, elle doit répondre à deux exigences :

  1. Visible publiquement
  2. Suffisamment populaire

Pour vérifier que votre origine est détectable, exécutez un audit Lighthouse et examinez les résultats de la catégorie "SEO". Votre site n'est pas détectable si votre page racine échoue aux audits Page bloquée de l'indexation ou Page avec un code d'état HTTP d'échec.

Si une origine est considérée comme publiquement détectable, les expériences utilisateur éligibles sur toutes les pages de cette origine sont agrégées au niveau de l'origine, quelle que soit la détectabilité des pages individuelles. Toutes ces expériences sont prises en compte dans l'exigence de popularité de l'origine.

Pour les requêtes, notez que toutes les origines du jeu de données CrUX sont en minuscules.

Page

Les exigences pour qu'une page soit incluse dans l'ensemble de données CrUX sont les mêmes que pour les origines :

  1. Visible publiquement
  2. Suffisamment populaire

Vous pouvez vérifier qu'une page est détectable en exécutant un audit Lighthouse et en examinant les résultats de la catégorie "SEO". Votre page n'est pas détectable si elle échoue aux audits Page bloquée de l'indexation ou La page renvoie un code d'état HTTP d'échec.

Si une page est publiquement détectable pour certains utilisateurs, mais renvoie un état HTTP non réussi dans certaines circonstances, ces expériences ne seront pas incluses dans CrUX.

Les pages comportent généralement des identifiants supplémentaires dans leur URL, y compris des paramètres de chaîne de requête tels que ?utm_medium=email et des fragments tels que #main. Ces identifiants sont supprimés de l'URL dans l'ensemble de données CrUX afin que toutes les expériences utilisateur sur la page soient agrégées. Cela est utile pour les pages qui ne répondraient pas au seuil de popularité s'il existait de nombreuses variantes d'URL distinctes pour la même page. Notez que, dans de rares cas, cela peut regrouper de manière inattendue des expériences pour des pages distinctes, par exemple si les paramètres ?productID=101 et ?productID=102 représentent des pages différentes.

Dans CrUX, les pages sont mesurées en fonction de la page de premier niveau. Les pages incluses en tant qu'iFrames ne sont pas signalées séparément dans CrUX, mais contribuent aux métriques de la page de premier niveau. Par exemple, si https://www.example.com/page.html intègre https://www.example.com/frame.html dans un iFrame, page.html sera représenté dans CrUX (sous réserve des autres critères d'éligibilité), mais frame.html ne le sera pas. Si frame.html présente un CLS faible, il sera inclus dans la mesure du CLS pour page.html. CrUX est le rapport d'expérience utilisateur Chrome. Il est possible qu'un utilisateur ne sache même pas qu'il s'agit d'un iFrame. L'expérience est donc mesurée au niveau de la page principale, telle qu'elle est perçue par l'utilisateur.

L'architecture d'un site Web peut compliquer la représentation de ses données dans CrUX. Par exemple, les applications monopages (SPA) peuvent utiliser un schéma de transition de route basé sur JavaScript pour passer d'une page à l'autre, au lieu des navigations de page classiques basées sur des ancres. Ces transitions apparaissent comme de nouvelles pages vues pour l'utilisateur, mais pour Chrome et les API de plate-forme sous-jacentes, l'ensemble de l'expérience est attribué à la page vue initiale. Il s'agit d'une limite des API de la plate-forme Web sur lesquelles CrUX est basé. Pour en savoir plus, consultez Comment les architectures SPA affectent les Core Web Vitals sur web.dev.

Utilisateur

Pour qu'un utilisateur puisse voir ses expériences agrégées dans l'ensemble de données CrUX, il doit répondre aux critères suivants :

  1. Activez les rapports sur les statistiques d'utilisation.
  2. Synchroniser leur historique du navigateur
  3. ne pas avoir défini de phrase secrète de synchronisation.
  4. Utilisez une plate-forme compatible.

Voici les plates-formes actuellement compatibles :

  • Versions de bureau de Chrome, y compris les systèmes d'exploitation Windows, macOS, ChromeOS et Linux.
  • Versions Android de Chrome, y compris les applications mobiles utilisant les onglets personnalisés et les WebAPKs.

Il existe quelques exceptions notables qui ne fournissent pas de données à l'ensemble de données CrUX :

  • Chrome sur iOS.
  • Applications Android utilisant WebView.
  • Autres navigateurs Chromium (par exemple, Microsoft Edge).

Chrome ne publie pas de données sur la proportion d'utilisateurs qui répondent à ces critères. Pour en savoir plus sur les données que nous collectons dans Chrome,

Accelerated Mobile Pages (AMP)

Les pages créées avec AMP sont incluses dans l'ensemble de données CrUX comme n'importe quelle autre page Web. Depuis la version de juin 2020 de CrUX, les pages diffusées à l'aide du AMP Cache et / ou affichées dans le lecteur AMP sont également capturées et attribuées à l'URL de la page de l'éditeur.

Qualité des données

Les données de CrUX sont traitées légèrement pour s'assurer qu'elles sont statistiquement exactes, bien structurées et plus faciles à interroger.

Filtrage

L'ensemble de données CrUX est filtré pour garantir la validité statistique des données présentées. Cela peut exclure des pages ou des origines entières de l'ensemble de données.

En plus des critères d'éligibilité appliqués aux origines et aux pages, un filtrage supplémentaire est appliqué aux segments dans les données :

Les origines ou les pages dont plus de 20% du trafic total sont exclus en raison de combinaisons de dimensions non éligibles sont entièrement exclues de l'ensemble de données.

Étant donné que l'ensemble de données au niveau mondial englobe les expériences utilisateur de tous les pays, les combinaisons de dimensions qui ne répondent pas aux critères de popularité au niveau national peuvent toujours être incluses au niveau mondial, à condition qu'elles soient suffisamment populaires.

Fuzzing (tests à données aléatoires)

Une petite part d'aléatoire est appliquée à l'ensemble de données pour empêcher la rétro-ingénierie des données sensibles, telles que les volumes de trafic totaux. Cela n'affecte pas la précision des statistiques globales.

Précision

La plupart des valeurs de métriques du jeu de données CrUX sont représentées sous forme d'histogrammes de valeurs et de tailles de bins, où la valeur de l'histogramme est une fraction de tous les segments inclus, dont la somme est égale à 1. Les tailles de bins sont des nombres à virgule flottante compris entre 1,0 et 0,0001.

Les largeurs des bins de l'histogramme sont normalisées pour simplifier l'interrogation et la visualisation des données. Cela signifie que les bins plus grands peuvent être divisés en bins plus petits, qui partagent de manière égale la densité d'origine afin de maintenir des largeurs de bins cohérentes.

Licence

Les ensembles de données CrUX de Google sont concédés sous licence Creative Commons Attribution 4.0 International.