CrUX ב-BigQuery

כאן אפשר ללמוד על המבנה של נתוני CrUX ב-BigQuery.

מבוא

הנתונים הגולמיים שמאחורי דוח חוויית המשתמש ב-Chrome (CrUX) זמינים ב-BigQuery, מסד נתונים שמתארח ב-Google Cloud.

CrUX ב-BigQuery מאפשר למשתמשים לבצע שאילתות ישירות על מערך הנתונים המלא החל מ-2017, לדוגמה כדי לנתח מגמות, להשוות טכנולוגיות אינטרנט ודומיינים של נקודות השוואה.

הנתונים בנויים לפי גרסה חודשית, וגם לפי מספר טבלאות סיכום, כדי לאפשר גישה פשוטה לשאילתות הנתונים.

נתוני BigQuery הם הבסיס למרכז הבקרה של CrUX, שמאפשר להציג את הנתונים האלה באופן חזותי בלי לכתוב שאילתות SQL.

גישה למערך הנתונים

כדי להשתמש ב-BigQuery צריך חשבון Google Cloud וידע בסיסי ב-SQL. אפשר לגשת אל מערך הנתונים של CrUX ב-BigQuery ולבדוק את מכסת השימוש בו, בהתאם למגבלות של תוכנית ללא תשלום, שמתחדשת מדי חודש ומסופקת על ידי BigQuery. בנוסף, משתמשים חדשים ב-Google Cloud עשויים להיות זכאים לזיכוי הרשמה כדי לכסות הוצאות מעבר לתוכנית ללא תשלום. הערה: צריך לספק כרטיס אשראי לפרויקט ב-Google Cloud. מידע נוסף זמין במאמר למה צריך לספק כרטיס אשראי?

אם זו הפעם הראשונה שאתם משתמשים ב-BigQuery, כדי להגדיר פרויקט יש לבצע את השלבים הבאים:

  1. עוברים אל Create a Project במסוף Google Cloud.
  2. נותנים שם לפרויקט החדש, למשל 'דוח חוויית המשתמש שלי ב-Chrome' ולוחצים על 'יצירה'.
  3. אם מופיעה בקשה, מציינים את נתוני החיוב.
  4. עוברים אל מערך הנתונים של CrUX ב-BigQuery

עכשיו אתם מוכנים להתחיל להריץ שאילתות על מערך הנתונים.

ארגון הפרויקט

נתוני CrUX ב-BigQuery מתפרסמים ביום שלישי השני של החודש הבא. כל חודש מופיע כטבלה חדשה בקטע chrome-ux-report.all. קיימות גם מספר טבלאות מהותיות שמספקות סיכום של הנתונים הסטטיסטיים בכל חודש.

סכימת טבלאות מפורטת

הטבלאות הגולמיות לכל מדינה ומערך הנתונים all מוצגות לפי שנה וחודש.

טבלאות גולמיות

הטבלאות הגולמיות כוללות את הסכימה הבאה:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

סכימת טבלה ממוחשבת

המערכת מספקת טבלאות מורכבות לצורך גישה קלה יותר לנתוני סיכום לפי כמה ממאפייני המפתח. לא מסופקות היסטוגרמות, במקום זאת נתוני הביצועים נצברים לשברים לפי הערכת הביצועים והערך באחוזון ה-75. בדוגמה הזו מוצגת קבוצת שורות לדוגמה מהטבלה metrics_summary:

yyyymm מקור fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1,600
202203 https://example.com 0.9209 0.052 0.0274 1,400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

ניתן לראות שבמערך הנתונים של שנת 202204, 90.56% מחוויות המשתמשים בפועל ב-https://example.com עמדו בקריטריונים של LCP טוב, ושערך ה-LCP באחוזון ה-75 היה 1,600 אלפיות השנייה. זו תקופה מעט איטית יותר מהחודשים הקודמים.

מוצגות ארבע טבלאות מורכבות:

metrics_summary
מדדים עיקריים לפי חודש ומקור
device_summary
מדדים עיקריים לפי חודש, מקור וסוג מכשיר
country_summary
מדדים עיקריים לפי חודש, מקור, סוג המכשיר ומדינה
origin_summary
רשימה של כל המקורות הכלולים במערך הנתונים

metrics_summary

הטבלה metrics_summary מכילה סיכום של נתונים סטטיסטיים לכל מקור ולכל מערך נתונים חודשי:

yyyymm
החודש של תקופת איסוף הנתונים
origin
כתובת ה-URL של מקור האתר
rank
דירוג פופולריות משוער (נכון למרץ 2021)
[small|medium|large]_cls
החלק היחסי של התנועה לפי ערכי סף ב-CLS
[fast|avg|slow]_<metric>
החלק היחסי של התנועה לפי ערכי סף לביצועים
p75_<metric>
ערך האחוזון ה-75 של מדדי ביצועים (אלפיות שנייה)
notification_permission_[accept|deny|ignore|dismiss]
החלק היחסי של ההתנהגויות ההרשאות לשליחת התראות
[desktop|phone|tablet]Density
חלק של התנועה לפי גורם צורה
[_4G|_3G|_2G|slow2G|offline]Density
חלוקת התנועה לפי סוג החיבור האפקטיבי
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
חלק של סוגי הניווט

device_summary

הטבלה device_summary מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary יש:

device
גורם הצורה של המכשיר

country_summary

הטבלה country_summary מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary יש:

country_code
קוד מדינה בן שתי אותיות
device
גורם הצורה של המכשיר

origin_summary

הטבלה origin_summary מכילה רשימה של כל המקורות במערך הנתונים של CrUX. היא מתעדכנת מדי חודש ומופיעה בה הרשימה העדכנית ביותר של המקורות במערך הנתונים, והיא כוללת עמודה אחת: origin.

מערך נתונים ניסיוני

הטבלאות במערך הנתונים הניסיוני הן עותקים מדויקים של טבלאות ברירת המחדל של YYYYMM, אבל נעשה בהן שימוש בתכונות חדשות ומתקדמות יותר של BigQuery, כמו חלוקה למחיצות ואשכולות, שמאפשרות לכם לכתוב שאילתות מהירות, פשוטות וזולות יותר.

country

מערך הנתונים experimental.country מכיל נתונים נצברים ממערכי הנתונים של country_CC עם עמודה yyyymm נוספת לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות עם הוספת עמודות התאריך ו-country_code, וכך מאפשרת לבצע השוואה ברמת המדינה לאורך זמן בלי להצטרף לטבלאות החודשיות.

global

מערך הנתונים experimental.global מכיל נתונים נצברים ממערך הנתונים all עם עמודה yyyymm נוספת לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות עם הוספת התאריך, כדי לאפשר ביצוע של שאילתות לאורך זמן בלי להצטרף לטבלאות החודשיות.