瞭解 CrUX 資料在 BigQuery 中的結構。
簡介
你可以在 BigQuery (託管於 Google Cloud 的資料庫) 中取得 Chrome 使用者體驗報告 (CrUX) 背後的原始資料。
使用者可透過 BigQuery 的 CrUX 直接查詢 2017 年以前的完整資料集,例如分析趨勢、比較網頁技術和基準網域。
資料以每月版本為單位進行結構化,並提供多個摘要表格,方便使用者查詢資料。
BigQuery 資料是 CrUX 資訊主頁的基礎,可讓您不必編寫 SQL 查詢,即可將資料以圖表呈現。
存取資料集
使用 BigQuery 需要具備 Google Cloud 帳戶和 SQL 的基本知識。BigQuery 的 CrUX 資料集可供免費使用及探索免費方案的用量限制。免費方案會按月續訂,並由 BigQuery 提供。此外,Google Cloud 新使用者可能符合註冊抵免額的資格,可用於支付免費方案以外的費用。請注意,Google Cloud 專案必須提供信用卡,請參閱「為什麼我需要提供信用卡?」一節。
如果您是第一次使用 BigQuery,請按照下列步驟設定專案:
- 前往 Google Cloud 控制台的「建立專案」。
- 為新專案命名 (例如「我的 Chrome 使用者體驗報告」),然後按一下「建立」。
- 在系統顯示提示時提供帳單資訊。
- 前往 BigQuery 的 CrUX 資料集
您現在可以開始查詢資料集。
專案機構
BigQuery 上的 CrUX 資料會在下個月的第二個星期二發布。每個月都會發布為 chrome-ux-report.all
下的新表格。此外,我們也有多個具體化表格,提供每個月的摘要統計資料。
- chrome-ux-report
詳細資料表結構定義
每個國家/地區和 all
資料集的原始資料表會按年和月提供。
原始資料表
原始資料表具有下列結構定義:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
具體化資料表結構定義
具體化表格能夠透過多種鍵維度輕鬆存取摘要資料,系統不會提供直方圖,而是會依據效能評估和第 75 個百分位數值,將成效資料匯總成分數。以下範例顯示 metrics_summary
資料表的一組資料列:
yyyymm | 起源 | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 美元 | 0.0635 | 0.0301 版 | 1600 |
202203 | https://example.com | $0.9209 美元 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | $0.9169 美元 | 0.0545 | 0.0284 年 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 年 | 1500 |
這表示在 202204 資料集中,90.56% 的實際使用者體驗符合「良好 LCP」的標準,且粗略的第 75 個百分位數 LCP 值為 1,600 毫秒。這比前幾個月的速度稍慢。
系統提供四個具體化資料表:
metrics_summary
- 依月份和來源顯示重要指標
device_summary
- 按月份、來源和裝置類型劃分的重要指標
country_summary
- 按月份、來源、裝置類型和國家/地區劃分的關鍵指標
origin_summary
- 資料集中包含的所有來源清單
metrics_summary
metrics_summary
表格包含每個來源和每個月資料集的摘要統計資料:
yyyymm
- 資料收集期間的月份
origin
- 網站來源網址
rank
- 約略人氣排名 (截至 2021 年 3 月)
[small|medium|large]_cls
- 依 CLS 門檻計算的流量百分比
[fast|avg|slow]_<metric>
- 流量比例 (按成效門檻劃分)
p75_<metric>
- 成效指標的 75 百分位數值 (毫秒)
notification_permission_[accept|deny|ignore|dismiss]
- 通知權限行為的比例
[desktop|phone|tablet]Density
- 依板型規格區分的流量比例
[_4G|_3G|_2G|slow2G|offline]Density
- 依有效連線類型區分的流量比例
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- 導覽類型的比例
device_summary
device_summary
資料表包含依月份、來源、國家/地區和裝置匯總的統計資料。除了 metrics_summary
欄外,還有:
device
- 裝置板型規格
country_summary
country_summary
資料表包含依月份、來源、國家/地區和裝置匯總的統計資料。除了 metrics_summary
欄外,還有:
country_code
- 雙字母國家/地區代碼
device
- 裝置板型規格
origin_summary
origin_summary
資料表包含 CrUX 資料集內所有來源的清單;資料每月更新,內含資料集的最新來源清單,且只有單一資料欄:origin
。
實驗資料集
實驗用資料集裡的資料表是預設 YYYYMM
資料表的複本,但它們運用了較新、更進階的 BigQuery 功能 (例如分區和分群),讓編寫查詢更快、更簡單、更便宜。
country
experimental.country
資料集包含 country_CC
資料集的匯總資料,而資料集日期又有額外的 yyyymm
資料欄。這個結構定義與原始資料表相同,但多了日期和 country_code
資料欄,因此可在不彙整每月資料表的情況下,執行國家/地區層級的比較資料。
global
experimental.global
資料集包含 all
資料集的匯總資料,以及資料集日期的其他 yyyymm
資料欄。這個結構定義與原始資料表相同,但加上日期資料,因此不必彙整每月資料表,即可比較不同時間的查詢執行情況。