CrUX ใน BigQuery

ดูโครงสร้างข้อมูล CrUX ใน BigQuery

บทนำ

ข้อมูลดิบที่อยู่เบื้องหลังรายงาน UX ของ Chrome (CrUX) มีอยู่ใน BigQuery ซึ่งเป็นฐานข้อมูลที่โฮสต์ใน Google Cloud

CrUX ใน BigQuery ช่วยให้ผู้ใช้ค้นหาชุดข้อมูลทั้งหมดย้อนหลังไปถึงปี 2017 ได้โดยตรง เช่น เพื่อวิเคราะห์แนวโน้ม เปรียบเทียบเทคโนโลยีเว็บ และเปรียบเทียบโดเมน

ข้อมูลมีโครงสร้างตามรุ่นรายเดือน รวมถึงตารางสรุปจำนวนหนึ่งเพื่อให้เข้าถึงการค้นหาข้อมูลได้ง่าย

ข้อมูล BigQuery เป็นพื้นฐานของแดชบอร์ด CrUX ซึ่งช่วยให้คุณแสดงข้อมูลนี้เป็นภาพได้โดยไม่ต้องเขียนการค้นหา SQL

เข้าถึงชุดข้อมูล

การใช้ BigQuery ต้องมีบัญชี Google Cloud และความรู้พื้นฐานเกี่ยวกับ SQL ชุดข้อมูล CRUX ใน BigQuery เข้าถึงและสำรวจได้ฟรีตามขีดจํากัดของแพ็กเกจรุ่นฟรี ซึ่งจะต่ออายุทุกเดือนและให้บริการโดย BigQuery นอกจากนี้ ผู้ใช้ Google Cloud รายใหม่อาจมีสิทธิ์ได้รับเครดิตการลงชื่อสมัครใช้เพื่อครอบคลุมค่าใช้จ่ายนอกเหนือจากแพ็กเกจแบบไม่มีค่าใช้จ่าย โปรดทราบว่าคุณต้องระบุบัตรเครดิตสำหรับโปรเจ็กต์ Google Cloud โปรดดูเหตุใดฉันจึงต้องระบุบัตรเครดิต

หากใช้ BigQuery เป็นครั้งแรก ให้ทําตามขั้นตอนต่อไปนี้เพื่อตั้งค่าโปรเจ็กต์

  1. ไปที่สร้างโปรเจ็กต์ในคอนโซล Google Cloud
  2. ตั้งชื่อโปรเจ็กต์ใหม่ เช่น "รายงาน UX ของ Chrome ของฉัน" แล้วคลิกสร้าง
  3. ระบุข้อมูลสำหรับการเรียกเก็บเงินหากได้รับข้อความแจ้ง
  4. ไปที่ชุดข้อมูล CRUX ใน BigQuery

ตอนนี้คุณก็พร้อมเริ่มค้นหาชุดข้อมูลแล้ว

การจัดระเบียบโปรเจ็กต์

ข้อมูล CrUX ใน BigQuery จะเผยแพร่ในวันอังคารที่ 2 ของเดือนถัดไป โดยแต่ละเดือนจะเผยแพร่เป็นตารางใหม่ในส่วน chrome-ux-report.all นอกจากนี้ยังมีตารางที่สร้างขึ้นซึ่งแสดงสถิติสรุปของแต่ละเดือน

สคีมาตารางแบบละเอียด

ตารางข้อมูลดิบของแต่ละประเทศและชุดข้อมูล all จะแสดงตามปีและเดือน

ตารางดิบ

ตารางดิบมีสคีมาดังต่อไปนี้

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

สคีมาตารางที่เป็นรูปธรรม

ตารางที่แสดงผลเป็นวัตถุมีไว้เพื่อให้เข้าถึงข้อมูลสรุปตามมิติข้อมูลหลักต่างๆ ได้ง่ายขึ้น ระบบจะไม่แสดงฮิสโตแกรม แต่ระบบจะรวบรวมข้อมูลประสิทธิภาพเป็นเศษตามการประเมินประสิทธิภาพและค่า 75 เปอร์เซ็นต์ ตัวอย่างชุดแถวจากตาราง metrics_summary แสดงอยู่ในตัวอย่างนี้

yyyymm origin fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1,600
202203 https://example.com 0.9209 0.052 0.0274 1,400
202202 https://example.com 0.9169 0.0545 0.0284 1,500
202201 https://example.com 0.9072 0.0626 0.0298 1,500

ข้อมูลนี้แสดงให้เห็นว่าในชุดข้อมูล 202204 ประสบการณ์ของผู้ใช้จริง 90.56% ใน https://example.com เป็นไปตามเกณฑ์LCP ดี และค่า LCP ของเปอร์เซ็นต์ไทล์ 75 ขั้นต้นคือ 1,600 มิลลิวินาที ซึ่งช้ากว่าเดือนก่อนหน้าเล็กน้อย

ตารางที่แสดงผลแล้ว 4 ตาราง ได้แก่

metrics_summary
เมตริกหลักตามเดือนและต้นทาง
device_summary
เมตริกหลักตามเดือน ต้นทาง และประเภทอุปกรณ์
country_summary
เมตริกหลักตามเดือน ต้นทาง ประเภทอุปกรณ์ และประเทศ
origin_summary
รายการต้นทางทั้งหมดที่รวมอยู่ในชุดข้อมูล

metrics_summary

ตาราง metrics_summary มีสถิติสรุปสำหรับต้นทางแต่ละแห่งและชุดข้อมูลรายเดือนแต่ละชุด ดังนี้

yyyymm
เดือนของระยะเวลาการเก็บรวบรวมข้อมูล
origin
URL ของต้นทางเว็บไซต์
rank
การจัดอันดับความนิยมคร่าวๆ (ณ เดือนมีนาคม 2021)
[small|medium|large]_cls
เศษส่วนของการเข้าชมตามเกณฑ์ CLS
[fast|avg|slow]_<metric>
เศษส่วนของการเข้าชมตามเกณฑ์ประสิทธิภาพ
p75_<metric>
ค่าเปอร์เซ็นไทล์ที่ 75 ของเมตริกประสิทธิภาพ (มิลลิวินาที)
notification_permission_[accept|deny|ignore|dismiss]
เศษส่วนของลักษณะการทํางานของสิทธิ์การแจ้งเตือน
[desktop|phone|tablet]Density
เศษส่วนของการเข้าชมตามรูปแบบของอุปกรณ์
[_4G|_3G|_2G|slow2G|offline]Density
เศษส่วนของการเข้าชมตามประเภทการเชื่อมต่อที่มีผล
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
เศษส่วนของประเภทการนําทาง

device_summary

ตาราง device_summary มีสถิติรวมตามเดือน ต้นทาง ประเทศ และอุปกรณ์ นอกจากคอลัมน์ metrics_summary แล้วยังมีรายการต่อไปนี้

device
รูปแบบ
ของอุปกรณ์

country_summary

ตาราง country_summary มีสถิติรวมตามเดือน ต้นทาง ประเทศ และอุปกรณ์ นอกจากคอลัมน์ metrics_summary แล้วยังมีรายการต่อไปนี้

country_code
รหัสประเทศ 2 ตัวอักษร
device
รูปแบบ
ของอุปกรณ์

origin_summary

ตาราง origin_summary มีรายการต้นทางทั้งหมดในชุดข้อมูล CrUX ซึ่งจะอัปเดตทุกเดือนด้วยรายการต้นทางล่าสุดในชุดข้อมูล และมีคอลัมน์เดียวคือ origin

ชุดข้อมูลทดลอง

ตารางในชุดข้อมูลทดสอบเป็นสำเนาที่ตรงกันทุกประการของตาราง YYYYMM เริ่มต้น แต่จะใช้ฟีเจอร์ BigQuery ที่ใหม่และทันสมัยกว่า เช่น การแบ่งพาร์ติชันและการคลัสเตอร์ ซึ่งช่วยให้คุณเขียนการค้นหาได้เร็วขึ้น ง่ายขึ้น และประหยัดค่าใช้จ่าย

country

ชุดข้อมูล experimental.country มีข้อมูลที่รวบรวมจากชุดข้อมูล country_CC โดยมีคอลัมน์ yyyymm เพิ่มเติมสำหรับวันที่ของชุดข้อมูล สคีมานี้เหมือนกับตารางดิบ โดยมีการเพิ่มคอลัมน์วันที่และ country_code ซึ่งช่วยให้สามารถเรียกใช้การค้นหาแบบเปรียบเทียบระดับประเทศตามช่วงเวลาได้โดยไม่ต้องเข้าร่วมตารางรายเดือน

global

ชุดข้อมูล experimental.global มีข้อมูลที่รวบรวมจากชุดข้อมูล all โดยมีคอลัมน์ yyyymm เพิ่มเติมสำหรับวันที่ของชุดข้อมูล สคีมานี้เหมือนกับตารางดิบ แต่เพิ่มวันที่เข้าไปด้วย ซึ่งช่วยให้สามารถเรียกใช้การค้นหาเพื่อเปรียบเทียบตามช่วงเวลาได้โดยไม่ต้องรวมตารางรายเดือน