Scopri come sono strutturati i dati di CrUX su BigQuery.
Introduzione
I dati non elaborati alla base del Report sull'esperienza utente di Chrome (CrUX) sono disponibili su BigQuery, un database ospitato su Google Cloud.
CrUX su BigQuery consente agli utenti di eseguire query direttamente sull'intero set di dati a partire dal 2017, ad esempio per analizzare le tendenze, confrontare le tecnologie web e eseguire il benchmarking dei domini.
I dati sono strutturati in base alla release mensile, oltre a una serie di tabelle di riepilogo per fornire un accesso semplice per eseguire query sui dati.
I dati di BigQuery costituiscono la base della dashboard di CrUX, che consente di visualizzare questi dati senza scrivere query SQL.
Accedere al set di dati
L'utilizzo di BigQuery richiede un account Google Cloud e una conoscenza di base dell'SQL. L'accesso al set di dati CrUX su BigQuery e l'esplorazione sono senza costi fino ai limiti del livello senza costi, che viene rinnovato mensilmente e viene fornito da BigQuery. Inoltre, i nuovi utenti di Google Cloud potrebbero avere diritto a un credito di registrazione per coprire le spese oltre il livello senza costi. Tieni presente che per il progetto Google Cloud deve essere fornita una carta di credito. Consulta la sezione Perché devo fornire una carta di credito?.
Se è la prima volta che utilizzi BigQuery, segui questi passaggi per configurare un progetto:
- Vai a Crea un progetto nella console Google Cloud.
- Assegna un nome al nuovo progetto, ad esempio "Il mio report sull'esperienza utente di Chrome", e fai clic su Crea.
- Fornisci i tuoi dati di fatturazione, se richiesto.
- Vai al set di dati CrUX su BigQuery
Ora puoi iniziare a eseguire query sul set di dati.
Organizzazione del progetto
I dati di CrUX su BigQuery vengono rilasciati il secondo martedì del mese successivo. Ogni mese viene pubblicato come nuova tabella sotto chrome-ux-report.all
. Esistono anche una serie di tabelle materializzate che forniscono statistiche di riepilogo per ogni mese.
- `chrome-ux-report
Schema della tabella dettagliato
Le tabelle non elaborate per ogni paese e il set di dati all
sono forniti per anno e mese.
Tabelle non elaborate
Le tabelle non elaborate hanno il seguente schema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schema della tabella materializzata
Le tabelle materializzate vengono fornite per facilitare l'accesso ai dati di riepilogo in base a una serie di dimensioni chiave. Non vengono fornite istogrammi, ma i dati sul rendimento vengono aggregati in frazioni in base alla valutazione del rendimento e al valore del 75° percentile. In questo esempio viene mostrato un insieme di righe di esempio dalla tabella metrics_summary
:
aaaamm | origine | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Ciò dimostra che nel set di dati del 202204, il 90,56% delle esperienze con utenti reali su https://example.com
soddisfaceva i criteri di LCP buono e che il valore LCP approssimativo del 75° percentile era 1600 ms. Un valore leggermente inferiore rispetto ai mesi precedenti.
Sono fornite quattro tabelle materializzate:
metrics_summary
- Metriche chiave per mese e origine
device_summary
- metriche chiave per mese, origine e tipo di dispositivo
country_summary
- Metriche chiave per mese, origine, tipo di dispositivo e paese
origin_summary
- un elenco di tutte le origini incluse nel set di dati
metrics_summary
La tabella metrics_summary
contiene statistiche di riepilogo per ogni origine e per ogni set di dati mensile:
yyyymm
- Mese del periodo di raccolta dei dati
origin
- URL dell'origine del sito
rank
- Classifica approssimativa della popolarità (a partire da marzo 2021)
[small|medium|large]_cls
- frazione del traffico in base alle soglie CLS
[fast|avg|slow]_<metric>
- frazione di traffico per soglie di rendimento
p75_<metric>
- Valore del 75° percentile delle metriche sul rendimento (millisecondi)
notification_permission_[accept|deny|ignore|dismiss]
- frazione di comportamenti relativi alle autorizzazioni alle notifiche
[desktop|phone|tablet]Density
- frazione di traffico per fattore di forma
[_4G|_3G|_2G|slow2G|offline]Density
- frazione di traffico in base al tipo di connessione effettivo
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- frazione di tipi di navigazione
device_summary
La tabella device_summary
contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary
, sono presenti:
device
- Fattore di forma del dispositivo
country_summary
La tabella country_summary
contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary
, c'è:
country_code
- Codice paese di due lettere
device
- Fattore di forma del dispositivo
origin_summary
La tabella origin_summary
contiene un elenco di tutte le origini nel set di dati CrUX; viene aggiornata mensilmente con l'elenco più recente delle origini nel set di dati e ha una singola colonna: origin
.
Set di dati sperimentale
Le tabelle nel set di dati sperimentale sono copie esatte delle tabelle YYYYMM
predefinite, ma utilizzano funzionalità BigQuery più recenti e avanzate, come il partizionamento e il clustering, che consentono di scrivere query più veloci, semplici ed economiche.
country
Il set di dati experimental.country
contiene dati aggregati dei set di dati country_CC
con una colonna yyyymm
aggiuntiva per la data del set di dati. Lo schema è identico alle tabelle non elaborate con l'aggiunta delle colonne data e country_code
, che consentono di eseguire query di confronto nel tempo a livello di paese senza unire le tabelle mensili.
global
Il set di dati experimental.global
contiene dati aggregati del set di dati all
con una colonna yyyymm
aggiuntiva per la data del set di dati. Lo schema è identico a quello delle tabelle non elaborate con l'aggiunta della data, consentendo l'esecuzione di query di confronto nel tempo senza unire le tabelle mensili.