Saiba como os dados do CrUX são estruturados no BigQuery.
Introdução
Os dados brutos por trás do Chrome UX Report (CrUX, na sigla em inglês) estão disponíveis no BigQuery, um banco de dados hospedado no Google Cloud.
Com o CrUX do BigQuery, os usuários podem consultar diretamente o conjunto de dados completo desde 2017, por exemplo, para analisar tendências, comparar tecnologias da Web e comparar domínios.
Os dados são estruturados por versão mensal, bem como várias tabelas de resumo para fornecer acesso simples à consulta dos dados.
Os dados do BigQuery são a base do painel CrUX, que permite visualizar esses dados sem escrever consultas SQL.
Acessar o conjunto de dados
O uso do BigQuery requer uma conta do Google Cloud e conhecimento básico de SQL. O conjunto de dados CrUX no BigQuery é sem custo financeiro e pode ser acessado até o limite do nível sem custo financeiro, que é renovado mensalmente e fornecido pelo BigQuery. Além disso, novos usuários do Google Cloud podem se qualificar para um crédito de assinatura para cobrir as despesas além do nível sem custo financeiro. Um cartão de crédito precisa ser fornecido para o projeto do Google Cloud. Consulte Por que preciso fornecer um cartão de crédito?.
Se esta é a primeira vez que você usa o BigQuery, siga estas etapas para configurar um projeto:
- Acesse Criar um projeto no Console do Google Cloud.
- Dê ao seu novo projeto um nome, como "Meu relatório de UX do Chrome" e clique em "Criar".
- Forneça suas informações de faturamento, se solicitado.
- Acesse o conjunto de dados do CrUX no BigQuery.
Agora está tudo pronto para começar a consultar o conjunto de dados.
Organização do projeto
Os dados do CrUX no BigQuery são lançados na segunda terça-feira do mês seguinte. Cada mês é lançado como uma nova tabela em chrome-ux-report.all
. Há também várias tabelas materializadas que fornecem estatísticas resumidas para cada mês.
- "chrome-ux-report"
Esquema detalhado da tabela
As tabelas brutas para cada país e o conjunto de dados all
são fornecidas por ano e mês.
Tabelas brutas
As tabelas brutas têm o seguinte esquema:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Esquema de tabela materializada
As tabelas materializadas são fornecidas para facilitar o acesso aos dados resumidos por várias dimensões importantes. Nenhum histograma é fornecido. Os dados de desempenho são agregados em frações por avaliação de desempenho e pelo valor do 75o percentil. Um conjunto de linhas de exemplo da tabela metrics_summary
é mostrado neste exemplo:
aaaamm | origem | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1.400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1.500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1.500 |
Isso mostra que, no conjunto de dados de 202204, 90,56% das experiências de usuários reais no https://example.com
atenderam aos critérios de boa LCP, e que o valor aproximado da LCP do 75o percentil foi de 1.600 ms. Esse período é um pouco mais lento do que nos meses anteriores.
Quatro tabelas materializadas são fornecidas:
metrics_summary
- principais métricas por mês e origem
device_summary
- principais métricas por mês, origem e tipo de dispositivo
country_summary
- principais métricas por mês, origem, tipo de dispositivo e país
origin_summary
- Uma lista de todas as origens incluídas no conjunto de dados.
metrics_summary
A tabela metrics_summary
contém estatísticas resumidas de cada origem e conjunto de dados mensal:
yyyymm
- Mês do período de coleta de dados
origin
- URL da origem do site
rank
- Classificação de popularidade aproximada (desde março de 2021)
[small|medium|large]_cls
- fração do tráfego por limites de CLS
[fast|avg|slow]_<metric>
- fração do tráfego por limites de desempenho
p75_<metric>
- Valor do 75o percentil das métricas de desempenho (milissegundos)
notification_permission_[accept|deny|ignore|dismiss]
- fração dos comportamentos de permissão de notificações
[desktop|phone|tablet]Density
- fração do tráfego por formato
[_4G|_3G|_2G|slow2G|offline]Density
- fração do tráfego por tipo de conexão efetiva
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- fração dos tipos de navegação
device_summary
A tabela device_summary
contém estatísticas agregadas por mês, origem, país e dispositivo. Além das colunas metrics_summary
, há:
device
- Formato do dispositivo
country_summary
A tabela country_summary
contém estatísticas agregadas por mês, origem, país e dispositivo. Além das colunas metrics_summary
, há:
country_code
- Código do país de duas letras
device
- Formato do dispositivo
origin_summary
A tabela origin_summary
contém uma lista de todas as origens no conjunto de dados CrUX. Ela é atualizada mensalmente com a lista mais recente de origens no conjunto de dados e tem uma única coluna: origin
.
Conjunto de dados experimental
As tabelas no conjunto de dados experimental são cópias exatas das tabelas YYYYMM
padrão, mas usam recursos mais recentes e avançados do BigQuery, como particionamento e clustering, que permitem escrever consultas mais rápidas, simples e baratas.
country
O conjunto de dados experimental.country
contém dados agregados dos conjuntos de dados country_CC
com uma coluna yyyymm
adicional para a data do conjunto de dados. O esquema é idêntico às tabelas brutas com a adição das colunas "data" e "country_code
", permitindo a comparação no nível do país ao longo do tempo sem a necessidade de mesclar as tabelas mensais.
global
O conjunto de dados experimental.global
contém dados agregados do conjunto de dados all
com uma coluna yyyymm
extra para a data do conjunto de dados. O esquema é idêntico às tabelas brutas com a adição da data, permitindo a comparação ao longo do tempo de consultas sem mesclar as tabelas mensais.