Découvrez comment les données CrUX sont structurées dans BigQuery.
Présentation
Les données brutes qui sous-tendent le rapport d'expérience utilisateur Chrome (CrUX) sont disponibles sur BigQuery, une base de données hébergée sur Google Cloud.
CrUX sur BigQuery permet aux utilisateurs d'interroger directement l'ensemble de données complet depuis 2017, par exemple pour analyser des tendances, comparer des technologies Web et comparer des domaines.
Les données sont structurées par publication mensuelle, ainsi que par un certain nombre de tableaux récapitulatifs permettant de faciliter l'interrogation des données.
Les données BigQuery constituent la base du tableau de bord CrUX, qui vous permet de visualiser ces données sans avoir à écrire de requêtes SQL.
Accéder à l'ensemble de données
L'utilisation de BigQuery nécessite un compte Google Cloud et des connaissances de base de SQL. Vous pouvez consulter et explorer l'ensemble de données CrUX sur BigQuery sans frais dans les limites du niveau sans frais, qui est renouvelé tous les mois et fourni par BigQuery. De plus, les nouveaux utilisateurs de Google Cloud peuvent bénéficier d'un crédit à l'inscription pour couvrir les dépenses au-delà du quota sans frais. Notez qu'une carte de crédit doit être indiquée pour le projet Google Cloud. Consultez la section Pourquoi dois-je fournir une carte de crédit ?.
Si vous utilisez BigQuery pour la première fois, procédez comme suit pour configurer un projet:
- Accédez à Créer un projet dans la console Google Cloud.
- Donnez un nom à votre nouveau projet, par exemple "Mon rapport d'expérience utilisateur Chrome", puis cliquez sur "Créer".
- Indiquez vos informations de facturation si vous y êtes invité.
- Accédez à l'ensemble de données CrUX sur BigQuery.
Vous êtes maintenant prêt à interroger le jeu de données.
Organisation du projet
Les données CrUX sur BigQuery sont publiées le deuxième mardi du mois suivant. Chaque mois est publié sous la forme d'un nouveau tableau sous chrome-ux-report.all
. Il existe également un certain nombre de tables matérialisées qui fournissent des statistiques récapitulatives pour chaque mois.
- "chrome-ux-report"
Schéma détaillé de la table
Les tables brutes pour chaque pays et l'ensemble de données all
sont fournies par année et par mois.
Tables brutes
Les tables brutes présentent le schéma suivant:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schéma de la table matérialisée
Les tableaux matérialisées sont fournis pour faciliter l'accès aux données récapitulatives selon un certain nombre de dimensions clés. Aucun histogramme n'est fourni, mais les données de performances sont agrégées en fractions par évaluation des performances et par valeur du 75e centile. L'exemple suivant présente un ensemble de lignes de la table metrics_summary
:
aaaamm | origine | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1 400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Cela montre que dans l'ensemble de données de 202204, 90,56% des expériences utilisateur réelles sur https://example.com
répondaient aux critères d'un bon LCP et que la valeur approximative du LCP du 75e centile était de 1 600 ms. C'est un peu plus lent que les mois précédents.
Quatre tables matérialisées sont fournies:
metrics_summary
- métriques clés par mois et par origine
device_summary
- Métriques clés par mois, origine et type d'appareil
country_summary
- Métriques clés par mois, origine, type d'appareil et pays
origin_summary
- Liste de toutes les origines incluses dans l'ensemble de données
metrics_summary
La table metrics_summary
contient des statistiques récapitulatives pour chaque origine et chaque ensemble de données mensuel:
yyyymm
- Mois de la période de collecte des données
origin
- URL de l'origine du site
rank
- Classement général de popularité (en mars 2021)
[small|medium|large]_cls
- fraction du trafic en fonction des seuils CLS
[fast|avg|slow]_<metric>
- fraction du trafic par seuils de performances
p75_<metric>
- Valeur du 75e centile des métriques de performances (millisecondes)
notification_permission_[accept|deny|ignore|dismiss]
- fractionnement des autorisations de notifications
[desktop|phone|tablet]Density
- fraction du trafic par facteur de forme
[_4G|_3G|_2G|slow2G|offline]Density
- fraction du trafic par type de connexion effectif
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- fraction des types de navigation
device_summary
Le tableau device_summary
contient des statistiques agrégées par mois, origine, pays et appareil. En plus des colonnes metrics_summary
, on trouve les éléments suivants:
device
- Facteur de forme de l'appareil
country_summary
Le tableau country_summary
contient des statistiques agrégées par mois, origine, pays et appareil. En plus des colonnes metrics_summary
, on trouve les éléments suivants:
country_code
- Code pays à deux lettres
device
- Facteur de forme de l'appareil
origin_summary
La table origin_summary
contient la liste de toutes les origines de l'ensemble de données CrUX. Elle est mise à jour tous les mois avec la dernière liste des origines de l'ensemble de données et comporte une seule colonne: origin
.
Ensemble de données expérimental
Les tables de l'ensemble de données expérimental sont des copies exactes des tables YYYYMM
par défaut. Toutefois, elles utilisent les fonctionnalités BigQuery plus récentes et plus avancées telles que le partitionnement et le clustering, qui vous permettent d'écrire des requêtes plus rapides, plus simples et moins coûteuses.
country
L'ensemble de données experimental.country
contient des données globales issues des ensembles de données country_CC
, ainsi qu'une colonne yyyymm
supplémentaire pour la date de l'ensemble de données. Le schéma est identique aux tables brutes, avec l'ajout des colonnes de date et country_code
, ce qui permet de comparer les requêtes dans le temps au niveau des pays sans joindre les tables mensuelles.
global
L'ensemble de données experimental.global
contient des données globales issues de l'ensemble de données all
, ainsi qu'une colonne yyyymm
supplémentaire pour la date de l'ensemble de données. Le schéma est identique aux tables brutes, avec l'ajout de la date, ce qui permet de comparer les requêtes au fil du temps sans joindre les tables mensuelles.