CrUX su BigQuery

Scopri come sono strutturati i dati di CrUX su BigQuery.

Introduzione

I dati non elaborati alla base del report sull'esperienza utente di Chrome (CrUX) sono disponibili su BigQuery, un database ospitato su Google Cloud.

CrUX su BigQuery consente agli utenti di interrogare direttamente l'intero set di dati a partire dal 2017, ad esempio per analizzare le tendenze, confrontare tecnologie web e domini di benchmark.

I dati sono strutturati in base alla release mensile e a una serie di tabelle di riepilogo per semplificare l'accesso all'esecuzione di query sui dati.

I dati di BigQuery sono la base della dashboard di CrUX, che consente di visualizzarli senza scrivere query SQL.

Accedere al set di dati

L'utilizzo di BigQuery richiede un account Google Cloud e una conoscenza di base di SQL. L'accesso al set di dati CrUX su BigQuery è senza costi, fino ai limiti del livello senza costi, che viene rinnovato mensilmente e fornito da BigQuery. Inoltre, i nuovi utenti di Google Cloud potrebbero essere idonei a ricevere un credito di registrazione per coprire spese oltre il livello senza costi. Tieni presente che è necessario fornire una carta di credito per il progetto Google Cloud. Vedi Perché devo fornire una carta di credito?.

Se è la prima volta che utilizzi BigQuery, segui questi passaggi per configurare un progetto:

  1. Vai a Crea un progetto nella console Google Cloud.
  2. Assegna un nome al nuovo progetto, ad esempio "Il mio report sull'esperienza utente di Chrome", e fai clic su Crea.
  3. Fornisci i tuoi dati di fatturazione, se richiesto.
  4. Vai al set di dati CrUX su BigQuery

A questo punto puoi iniziare a eseguire query sul set di dati.

Organizzazione del progetto

I dati di CrUX su BigQuery vengono pubblicati il secondo martedì del mese successivo. Ogni mese viene rilasciato come nuova tabella in chrome-ux-report.all. Esistono anche alcune tabelle materializzate che forniscono statistiche riepilogative per ciascun mese.

Schema della tabella dettagliato

Le tabelle non elaborate per ogni paese e il set di dati all vengono forniti per anno e mese.

Tabelle non elaborate

Le tabelle non elaborate hanno il seguente schema:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schema della tabella materializzata

Le tabelle materializzate vengono fornite per facilitare l'accesso ai dati di riepilogo da parte di una serie di dimensioni chiave. Non vengono forniti istogrammi, ma i dati sulle prestazioni vengono aggregati in frazioni in base alla valutazione delle prestazioni e al valore del 75° percentile. In questo esempio viene mostrato un insieme di righe di esempio della tabella metrics_summary:

aaaamm origine fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Ciò mostra che nel set di dati del 202204, il 90,56% delle esperienze utente reali su https://example.com ha soddisfatto i criteri per un LCP buono e che il valore approssimativo di LCP del 75° percentile era di 1600 ms. Questo periodo è leggermente più lento rispetto ai mesi precedenti.

Vengono fornite quattro tabelle materializzate:

metrics_summary
metriche chiave per mese e origine
device_summary
metriche chiave per mese, origine e tipo di dispositivo
country_summary
metriche chiave per mese, origine, tipo di dispositivo e paese
origin_summary
un elenco di tutte le origini incluse nel set di dati

metrics_summary

La tabella metrics_summary contiene statistiche di riepilogo per ogni origine e ogni set di dati mensile:

yyyymm
Mese del periodo di raccolta dei dati
origin
URL del sito di origine
rank
Ranking di popolarità approssimativo (da marzo 2021)
[small|medium|large]_cls
frazione del traffico per soglie CLS
[fast|avg|slow]_<metric>
frazione del traffico per soglie di prestazioni
p75_<metric>
75° percentile del valore delle metriche sul rendimento (millisecondi)
notification_permission_[accept|deny|ignore|dismiss]
frazione dei comportamenti di autorizzazione alle notifiche
[desktop|phone|tablet]Density
frazione di traffico per fattore di forma
[_4G|_3G|_2G|slow2G|offline]Density
frazione del traffico per tipo di connessione efficace
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
frazione dei tipi di navigazione

device_summary

La tabella device_summary contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary sono presenti:

device
Fattore di forma del dispositivo

country_summary

La tabella country_summary contiene statistiche aggregate per mese, origine, paese e dispositivo. Oltre alle colonne metrics_summary sono presenti:

country_code
Codice paese di due lettere
device
Fattore di forma del dispositivo

origin_summary

La tabella origin_summary contiene un elenco di tutte le origini nel set di dati CrUX; viene aggiornata mensilmente con l'elenco più recente delle origini nel set di dati e ha una singola colonna: origin.

Set di dati sperimentale

Le tabelle nel set di dati sperimentale sono copie esatte delle tabelle YYYYMM predefinite, ma utilizzano funzionalità BigQuery più nuove e avanzate, come il partizionamento e il clustering, che consentono di scrivere query più semplici, veloci e economiche.

country

Il set di dati experimental.country contiene dati aggregati provenienti dal set di dati country_CC con una colonna yyyymm aggiuntiva per la data del set di dati. Lo schema è identico alle tabelle non elaborate, con l'aggiunta delle colonne country_code e della data, consentendo l'esecuzione di query di confronto a livello di paese nel tempo senza unire le tabelle mensili.

global

Il set di dati experimental.global contiene dati aggregati del set di dati all con una colonna yyyymm aggiuntiva per la data del set di dati. Lo schema è identico alle tabelle non elaborate con l'aggiunta della data, consentendo l'esecuzione di query di confronto nel tempo senza unire le tabelle mensili.