Scopri come sono strutturati i dati di CrUX su BigQuery.
Introduzione
I dati non elaborati alla base del report sull'esperienza utente di Chrome (CrUX) sono disponibili su BigQuery, un database ospitato su Google Cloud.
CrUX su BigQuery consente agli utenti di interrogare direttamente l'intero set di dati a partire dal 2017, ad esempio per analizzare le tendenze, confrontare tecnologie web e domini di benchmark.
I dati sono strutturati in base alla release mensile e a una serie di tabelle di riepilogo per semplificare l'accesso all'esecuzione di query sui dati.
I dati di BigQuery sono la base della dashboard di CrUX, che consente di visualizzarli senza scrivere query SQL.
Accedere al set di dati
L'utilizzo di BigQuery richiede un account Google Cloud e una conoscenza di base di SQL. L'accesso al set di dati CrUX su BigQuery è senza costi, fino ai limiti del livello senza costi, che viene rinnovato mensilmente e fornito da BigQuery. Inoltre, i nuovi utenti di Google Cloud potrebbero essere idonei a ricevere un credito di registrazione per coprire spese oltre il livello senza costi. Tieni presente che è necessario fornire una carta di credito per il progetto Google Cloud. Vedi Perché devo fornire una carta di credito?.
Se è la prima volta che utilizzi BigQuery, segui questi passaggi per configurare un progetto:
- Vai a Crea un progetto nella console Google Cloud.
- Assegna un nome al nuovo progetto, ad esempio "Il mio report sull'esperienza utente di Chrome", e fai clic su Crea.
- Fornisci i tuoi dati di fatturazione, se richiesto.
- Vai al set di dati CrUX su BigQuery
A questo punto puoi iniziare a eseguire query sul set di dati.
Organizzazione del progetto
I dati di CrUX su BigQuery vengono pubblicati il secondo martedì del mese successivo. Ogni mese viene rilasciato come nuova tabella in chrome-ux-report.all
. Esistono anche alcune tabelle materializzate che forniscono statistiche riepilogative per ciascun mese.
- "chrome-ux-report"
Schema della tabella dettagliato
Le tabelle non elaborate per ogni paese e il set di dati all
vengono forniti per anno e mese.
Tabelle non elaborate
Le tabelle non elaborate hanno il seguente schema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Schema della tabella materializzata
Le tabelle materializzate vengono fornite per facilitare l'accesso ai dati di riepilogo da parte di una serie di dimensioni chiave. Non vengono forniti istogrammi, ma i dati sulle prestazioni vengono aggregati in frazioni in base alla valutazione delle prestazioni e al valore del 75° percentile. In questo esempio viene mostrato un insieme di righe di esempio della tabella metrics_summary
:
aaaamm | origine | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Ciò mostra che nel set di dati del 202204, il 90,56% delle esperienze utente reali su https://example.com
ha soddisfatto i criteri per un LCP buono e che il valore approssimativo di LCP del 75° percentile era di 1600 ms. Questo periodo è leggermente più lento rispetto ai mesi precedenti.
Vengono fornite quattro tabelle materializzate:
metrics_summary
- metriche chiave per mese e origine
device_summary
- metriche chiave per mese, origine e tipo di dispositivo
country_summary
- metriche chiave per mese, origine, tipo di dispositivo e paese
origin_summary
- un elenco di tutte le origini incluse nel set di dati
metrics_summary
La tabella metrics_summary
contiene statistiche di riepilogo per ogni origine e ogni set di dati mensile:
yyyymm
- Mese del periodo di raccolta dei dati
origin
- URL del sito di origine
rank
- Ranking di popolarità approssimativo (da marzo 2021)
[small|medium|large]_cls
- frazione del traffico per soglie CLS
[fast|avg|slow]_<metric>
- frazione del traffico per soglie di prestazioni
p75_<metric>
- 75° percentile del valore delle metriche sul rendimento (millisecondi)
notification_permission_[accept|deny|ignore|dismiss]
- frazione dei comportamenti di autorizzazione alle notifiche
[desktop|phone|tablet]Density
- frazione di traffico per fattore di forma
[_4G|_3G|_2G|slow2G|offline]Density
- frazione del traffico per tipo di connessione efficace
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- frazione dei tipi di navigazione
device_summary
La tabella device_summary
contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary
sono presenti:
device
- Fattore di forma del dispositivo
country_summary
La tabella country_summary
contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary
sono presenti:
country_code
- Codice paese di due lettere
device
- Fattore di forma del dispositivo
origin_summary
La tabella origin_summary
contiene un elenco di tutte le origini nel set di dati CrUX; viene aggiornata mensilmente con l'elenco più recente delle origini nel set di dati e ha una singola colonna: origin
.
Set di dati sperimentale
Le tabelle nel set di dati sperimentale sono copie esatte delle tabelle YYYYMM
predefinite, ma utilizzano funzionalità BigQuery più nuove e avanzate, come il partizionamento e il clustering, che consentono di scrivere query più semplici, veloci e economiche.
country
Il set di dati experimental.country
contiene dati aggregati provenienti dal set di dati country_CC
con una colonna yyyymm
aggiuntiva per la data del set di dati. Lo schema è identico alle tabelle non elaborate, con l'aggiunta delle colonne country_code
e della data, consentendo l'esecuzione di query di confronto a livello di paese nel tempo senza unire le tabelle mensili.
global
Il set di dati experimental.global
contiene dati aggregati del set di dati all
con una colonna yyyymm
aggiuntiva per la data del set di dati. Lo schema è identico alle tabelle non elaborate con l'aggiunta della data, consentendo l'esecuzione di query di confronto nel tempo senza unire le tabelle mensili.