CrUX dans BigQuery

Découvrez comment les données CrUX sont structurées dans BigQuery.

Introduction

Les données brutes du rapport sur l'expérience utilisateur Chrome (CrUX) sont disponibles dans BigQuery, une base de données hébergée sur Google Cloud.

CrUX sur BigQuery permet aux utilisateurs d'interroger directement l'ensemble de données complet remontant à 2017, par exemple pour analyser les tendances, comparer les technologies Web et comparer les domaines.

Les données sont structurées par publication mensuelle, ainsi qu'un certain nombre de tableaux récapitulatifs pour faciliter l'accès aux données.

Les données BigQuery constituent la base du tableau de bord CRUX, qui vous permet de les visualiser sans avoir à écrire de requêtes SQL.

Accéder à l'ensemble de données

Pour utiliser BigQuery, vous devez disposer d'un compte Google Cloud et de connaissances de base en SQL. L'ensemble de données CRUX sur BigQuery est accessible et explorable sans frais dans la limite de la version sans frais, qui est renouvelée chaque mois et fournie par BigQuery. De plus, les nouveaux utilisateurs de Google Cloud peuvent bénéficier d'un crédit d'inscription pour couvrir les dépenses au-delà du niveau sans frais. Notez qu'une carte de crédit doit être fournie pour le projet Google Cloud. Consultez la section Pourquoi dois-je fournir une carte de crédit ?.

Si vous utilisez BigQuery pour la première fois, procédez comme suit pour configurer un projet:

  1. Accédez à Créer un projet dans la console Google Cloud.
  2. Attribuez un nom à votre projet, par exemple "Mon rapport UX Chrome", puis cliquez sur "Créer".
  3. Saisissez vos informations de facturation si vous y êtes invité.
  4. Accédez à l'ensemble de données CRUX dans BigQuery.

Vous pouvez maintenant commencer à interroger le jeu de données.

Organisation du projet

Les données CrUX dans BigQuery sont publiées le deuxième mardi du mois suivant. Chaque mois est publié sous forme de table dans chrome-ux-report.all. Un certain nombre de tables matérialisées fournissent également des statistiques récapitulatives pour chaque mois.

Schéma de table détaillé

Les tables brutes pour chaque pays et l'ensemble de données all sont fournies par année et par mois.

Tables brutes

Les tables brutes présentent le schéma suivant:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schéma de table matérialisée

Les tables matérialisées permettent d'accéder plus facilement aux données récapitulatives en fonction d'un certain nombre de dimensions clés. Aucun histogramme n'est fourni. Les données sur les performances sont regroupées en fractions en fonction de l'évaluation des performances et de la valeur du 75e centile. Un ensemble d'exemples de lignes de la table metrics_summary est présenté dans cet exemple:

aaaamm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Cela montre que, dans l'ensemble de données 202204, 90,56% des expériences utilisateur réelles sur https://example.com répondaient aux critères d'un bon LCP, et que la valeur LCP du 75e centile était de 1 600 ms. Ce chiffre est légèrement inférieur à celui des mois précédents.

Quatre tables matérialisées sont fournies:

metrics_summary
les métriques clés par mois et par origine ;
device_summary
les métriques clés par mois, par origine et par type d'appareil ;
country_summary
les métriques clés par mois, origine, type d'appareil et pays ;
origin_summary
une liste de toutes les origines incluses dans l'ensemble de données

metrics_summary

La table metrics_summary contient des statistiques récapitulatives pour chaque origine et chaque ensemble de données mensuel:

yyyymm
Mois de la période de collecte des données
origin
URL de l'origine du site
rank
Classement approximatif de la popularité (mars 2021)
[small|medium|large]_cls
fraction du trafic par seuils CLS
[fast|avg|slow]_<metric>
fraction du trafic par seuils de performances
p75_<metric>
Valeur du 75e centile des métriques de performances (en millisecondes)
notification_permission_[accept|deny|ignore|dismiss]
fraction des comportements liés aux autorisations de notification
[desktop|phone|tablet]Density
fraction du trafic par facteur de forme
[_4G|_3G|_2G|slow2G|offline]Density
fraction du trafic par type de connexion compatible
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
fraction des types de navigation

device_summary

Le tableau device_summary contient des statistiques agrégées par mois, origine, pays et appareil. En plus des colonnes metrics_summary, il existe:

device
Facteur de forme de l'appareil

country_summary

Le tableau country_summary contient des statistiques agrégées par mois, origine, pays et appareil. En plus des colonnes metrics_summary, vous trouverez:

country_code
Code pays à deux lettres
device
Facteur de forme de l'appareil

origin_summary

La table origin_summary contient la liste de toutes les origines de l'ensemble de données CrUX. Elle est mise à jour chaque mois avec la dernière liste des origines de l'ensemble de données et ne comporte qu'une seule colonne: origin.

Ensemble de données expérimental

Les tables de l'ensemble de données expérimental sont des copies exactes des tables YYYYMM par défaut, mais elles utilisent des fonctionnalités BigQuery plus récentes et plus avancées, comme le partitionnement et le clustering, qui vous permettent d'écrire des requêtes plus rapides, plus simples et moins coûteuses.

country

L'ensemble de données experimental.country contient des données agrégées des ensembles de données country_CC, avec une colonne yyyymm supplémentaire pour la date de l'ensemble de données. Le schéma est identique aux tables brutes, avec l'ajout des colonnes "date" et "country_code", ce qui permet d'exécuter des requêtes de comparaison au niveau des pays sur la période sans avoir à joindre les tables mensuelles.

global

L'ensemble de données experimental.global contient des données agrégées de l'ensemble de données all avec une colonne yyyymm supplémentaire pour la date de l'ensemble de données. Le schéma est identique aux tables brutes, avec l'ajout de la date, ce qui permet d'exécuter des requêtes de comparaison dans le temps sans joindre les tables mensuelles.