BigQuery 上的 CrUX

了解 CrUX 数据在 BigQuery 上的结构。

简介

Chrome 用户体验报告 (CrUX) 背后的原始数据可通过 BigQuery 获取,后者是一个托管在 Google Cloud 上的数据库。

借助 BigQuery 上的 CrUX,用户可以直接查询过去 2017 年的完整数据集,例如分析趋势、比较网络技术和基准领域。

这些数据按每月发布的方式和多个摘要表进行结构化处理,以便轻松查询数据。

BigQuery 数据是 CrUX 信息中心的基础,让您无需编写 SQL 查询即可直观呈现这些数据。

访问数据集

要使用 BigQuery,您需要有 Google Cloud 帐号并具备 SQL 基础知识。BigQuery 上的 CrUX 数据集可免费访问并探索免费层级,该层级由 BigQuery 提供,每月续订一次。此外,Google Cloud 新用户可能有资格获得注册赠金,以支付免费层级以外的费用。请注意,必须为 Google Cloud 项目提供信用卡,请参阅为什么我需要提供信用卡?

如果这是您第一次使用 BigQuery,请按照以下步骤设置项目:

  1. Google Cloud 控制台中,前往创建项目
  2. 为新项目命名,例如“My Chrome UX Report”(我的 Chrome 用户体验报告),然后点击“创建”。
  3. 如果系统提示,请提供您的结算信息。
  4. 前往 BigQuery 上的 CrUX 数据集

现在,您可以开始查询数据集了。

项目组织

BigQuery 上的 CrUX 数据将于次月的第二个星期二发布。每个月都会在 chrome-ux-report.all 下以一个新表的形式发布。此外,还有许多具体化表,可提供每个月的摘要统计信息。

详细的表架构

每个国家/地区的原始表和 all 数据集均按年和月提供。

原始表

原始表具有以下架构:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

具体化表架构

此外,还提供了具体化表,以便您按多个键维度更轻松地访问摘要数据。不提供直方图,而是按性能评估结果和第 75 百分位的值将性能数据汇总为多个分数。以下示例显示了 metrics_summary 表中的一组示例行:

yyyymm 发迹地 fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

这表明,在 202204 年数据集中,https://example.com 上 90.56% 的真实用户体验符合良好 LCP 的标准,第 75 百分位的 LCP 粗略值为 1,600 毫秒。与前几个月相比,这个时间略慢。

提供了四个具体化表:

metrics_summary
按月和按来源划分的关键指标
device_summary
按月、来源和设备类型的关键指标
country_summary
按月、出发地、设备类型和国家/地区的关键指标
origin_summary
数据集中包含的所有源的列表

metrics_summary

metrics_summary 表包含每个出发地和每个每月数据集的汇总统计信息:

yyyymm
数据收集期的月份
origin
网站源的网址
rank
粗略的热门程度排名(截至 2021 年 3 月
[small|medium|large]_cls
流量所占比例(按 CLS 阈值划分)
[fast|avg|slow]_<metric>
流量占比(按性能阈值)
p75_<metric>
性能指标的第 75 百分位值(毫秒)
notification_permission_[accept|deny|ignore|dismiss]
通知权限行为所占的比例
[desktop|phone|tablet]Density
流量占比(按设备规格细分
[_4G|_3G|_2G|slow2G|offline]Density
流量所占的流量比例(按有效连接类型划分)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
导航类型的比例

device_summary

device_summary 表格包含按月份、出发地、国家/地区和设备汇总的统计数据。除了 metrics_summary 列之外,还有:

device
设备外形规格

country_summary

country_summary 表格包含按月份、出发地、国家/地区和设备汇总的统计数据。除了 metrics_summary 列之外,还有:

country_code
双字母国家/地区代码
device
设备外形规格

origin_summary

origin_summary 表包含 CrUX 数据集中所有源站的列表;该表每月更新一次,采用数据集中的最新源站列表,且只有一列:origin

实验数据集

实验性数据集中的表是默认 YYYYMM 表的精确副本,但它们使用更新和更高级的 BigQuery 功能(例如分区聚类),可让您以更快、更简单、更便宜的方式编写查询。

country

experimental.country 数据集包含来自 country_CC 数据集的汇总数据,并针对数据集日期额外附加 yyyymm 列。此架构与原始表相同,只是添加了日期和 country_code 列,无需联接每月表,即可执行一段时间的国家/地区级查询。

global

experimental.global 数据集包含来自 all 数据集的汇总数据,并针对数据集日期额外附加 yyyymm 列。架构与原始表相同,只是添加了日期,无需联接每月表,即可对不同时间段的查询执行比较。