CrUX su BigQuery

Scopri come sono strutturati i dati di CrUX su BigQuery.

Introduzione

I dati non elaborati alla base del Report sull'esperienza utente di Chrome (CrUX) sono disponibili su BigQuery, un database ospitato su Google Cloud.

CrUX su BigQuery consente agli utenti di eseguire query direttamente sull'intero set di dati a partire dal 2017, ad esempio per analizzare le tendenze, confrontare le tecnologie web e eseguire il benchmarking dei domini.

I dati sono strutturati in base alla release mensile, oltre a una serie di tabelle di riepilogo per fornire un accesso semplice per eseguire query sui dati.

I dati di BigQuery costituiscono la base della dashboard di CrUX, che consente di visualizzare questi dati senza scrivere query SQL.

Accedere al set di dati

L'utilizzo di BigQuery richiede un account Google Cloud e una conoscenza di base dell'SQL. L'accesso al set di dati CrUX su BigQuery e l'esplorazione sono senza costi fino ai limiti del livello senza costi, che viene rinnovato mensilmente e viene fornito da BigQuery. Inoltre, i nuovi utenti di Google Cloud potrebbero avere diritto a un credito di registrazione per coprire le spese oltre il livello senza costi. Tieni presente che per il progetto Google Cloud deve essere fornita una carta di credito. Consulta la sezione Perché devo fornire una carta di credito?.

Se è la prima volta che utilizzi BigQuery, segui questi passaggi per configurare un progetto:

  1. Vai a Crea un progetto nella console Google Cloud.
  2. Assegna un nome al nuovo progetto, ad esempio "Il mio report sull'esperienza utente di Chrome", e fai clic su Crea.
  3. Fornisci i tuoi dati di fatturazione, se richiesto.
  4. Vai al set di dati CrUX su BigQuery

Ora puoi iniziare a eseguire query sul set di dati.

Organizzazione del progetto

I dati di CrUX su BigQuery vengono rilasciati il secondo martedì del mese successivo. Ogni mese viene pubblicato come nuova tabella sotto chrome-ux-report.all. Esistono anche una serie di tabelle materializzate che forniscono statistiche di riepilogo per ogni mese.

Schema della tabella dettagliato

Le tabelle non elaborate per ogni paese e il set di dati all sono forniti per anno e mese.

Tabelle non elaborate

Le tabelle non elaborate hanno il seguente schema:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schema della tabella materializzata

Le tabelle materializzate vengono fornite per facilitare l'accesso ai dati di riepilogo in base a una serie di dimensioni chiave. Non vengono fornite istogrammi, ma i dati sul rendimento vengono aggregati in frazioni in base alla valutazione del rendimento e al valore del 75° percentile. In questo esempio viene mostrato un insieme di righe di esempio dalla tabella metrics_summary:

aaaamm origine fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Ciò dimostra che nel set di dati del 202204, il 90,56% delle esperienze con utenti reali su https://example.com soddisfaceva i criteri di LCP buono e che il valore LCP approssimativo del 75° percentile era 1600 ms. Un valore leggermente inferiore rispetto ai mesi precedenti.

Sono fornite quattro tabelle materializzate:

metrics_summary
Metriche chiave per mese e origine
device_summary
metriche chiave per mese, origine e tipo di dispositivo
country_summary
Metriche chiave per mese, origine, tipo di dispositivo e paese
origin_summary
un elenco di tutte le origini incluse nel set di dati

metrics_summary

La tabella metrics_summary contiene statistiche di riepilogo per ogni origine e per ogni set di dati mensile:

yyyymm
Mese del periodo di raccolta dei dati
origin
URL dell'origine del sito
rank
Classifica approssimativa della popolarità (a partire da marzo 2021)
[small|medium|large]_cls
frazione del traffico in base alle soglie CLS
[fast|avg|slow]_<metric>
frazione di traffico per soglie di rendimento
p75_<metric>
Valore del 75° percentile delle metriche sul rendimento (millisecondi)
notification_permission_[accept|deny|ignore|dismiss]
frazione di comportamenti relativi alle autorizzazioni alle notifiche
[desktop|phone|tablet]Density
frazione di traffico per fattore di forma
[_4G|_3G|_2G|slow2G|offline]Density
frazione di traffico in base al tipo di connessione effettivo
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
frazione di tipi di navigazione

device_summary

La tabella device_summary contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary, sono presenti:

device
Fattore di forma
del dispositivo

country_summary

La tabella country_summary contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary, c'è:

country_code
Codice paese di due lettere
device
Fattore di forma
del dispositivo

origin_summary

La tabella origin_summary contiene un elenco di tutte le origini nel set di dati CrUX; viene aggiornata mensilmente con l'elenco più recente delle origini nel set di dati e ha una singola colonna: origin.

Set di dati sperimentale

Le tabelle nel set di dati sperimentale sono copie esatte delle tabelle YYYYMM predefinite, ma utilizzano funzionalità BigQuery più recenti e avanzate, come il partizionamento e il clustering, che consentono di scrivere query più veloci, semplici ed economiche.

country

Il set di dati experimental.country contiene dati aggregati dei set di dati country_CC con una colonna yyyymm aggiuntiva per la data del set di dati. Lo schema è identico alle tabelle non elaborate con l'aggiunta delle colonne data e country_code, che consentono di eseguire query di confronto nel tempo a livello di paese senza unire le tabelle mensili.

global

Il set di dati experimental.global contiene dati aggregati del set di dati all con una colonna yyyymm aggiuntiva per la data del set di dati. Lo schema è identico a quello delle tabelle non elaborate con l'aggiunta della data, consentendo l'esecuzione di query di confronto nel tempo senza unire le tabelle mensili.