הסבר על המבנה של נתוני CrUX ב-BigQuery
מבוא
הנתונים הגולמיים שמרכיבים את דוח חוויית המשתמש ב-Chrome (CrUX) זמינים ב-BigQuery, מסד נתונים שמתארח ב-Google Cloud.
CrUX ב-BigQuery מאפשר למשתמשים לשלוח שאילתות ישירות למערך הנתונים המלא החל משנת 2017, למשל כדי לנתח מגמות, להשוות בין טכנולוגיות אינטרנט ולבצע השוואות בין דומיינים.
הנתונים מחולקים לפי גרסה חודשית, ויש גם כמה טבלאות סיכום שמספקות גישה פשוטה לשאילתות על הנתונים.
נתוני BigQuery הם הבסיס של לוח הבקרה של CrUX, שמאפשר להציג את הנתונים האלה באופן חזותי בלי לכתוב שאילתות SQL.
גישה למערך הנתונים
כדי להשתמש ב-BigQuery צריך חשבון Google Cloud וידע בסיסי ב-SQL. הגישה למערך הנתונים של CrUX ב-BigQuery זמינה בחינם, וניתן לעיין בו עד למגבלות של התוכנית ללא תשלום, שמתחדשת מדי חודש ומסופקת על ידי BigQuery. בנוסף, משתמשים חדשים ב-Google Cloud עשויים להיות זכאים לזיכוי על הרשמה כדי לכסות הוצאות מעבר לרמה החינמית. חשוב לדעת: צריך לספק כרטיס אשראי לפרויקט ב-Google Cloud. אפשר לקרוא מידע נוסף במאמר למה צריך לספק כרטיס אשראי?.
אם זו הפעם הראשונה שאתם משתמשים ב-BigQuery, עליכם לפעול לפי השלבים הבאים כדי להגדיר פרויקט:
- עוברים אל Create a Project (יצירת פרויקט) במסוף Google Cloud.
- נותנים שם לפרויקט החדש, למשל 'דוח חוויית המשתמש שלי ב-Chrome', ולוחצים על 'יצירה'.
- מציינים את פרטי החיוב אם מוצגת בקשה לעשות זאת.
- עוברים אל מערך הנתונים של CrUX ב-BigQuery
עכשיו אפשר להתחיל לשלוח שאילתות למערך הנתונים.
ארגון פרויקטים
נתוני CrUX ב-BigQuery מתפרסמים ביום שלישי השני בחודש העוקב. כל חודש משוחרר כטבלה חדשה בקטע chrome-ux-report.all
. יש גם מספר טבלאות מותמרות שמספקות נתונים סטטיסטיים של סיכום לכל חודש.
- `chrome-ux-report
סכימה מפורטת של טבלה
הטבלאות הגולמיות של כל מדינה ומערך הנתונים all
מוצגים לפי שנה וחודש.
טבלאות גולמיות
לטבלאות הגולמיות יש את הסכימה הבאה:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
סכימה של טבלה מהותית
טבלאות מוטמעות נועדו לספק גישה קלה יותר לנתוני סיכום לפי מספר מאפייני מפתח. לא מוצגות היסטוגרמות, אלא נתוני הביצועים נצברים לחלקים לפי הערכת הביצועים והערך של האחוזון ה-75. בדוגמה הזו מוצגת קבוצה של שורות לדוגמה מהטבלה metrics_summary
:
yyyymm | מקור | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1,400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
הנתונים האלה מראים שבמערך הנתונים 202204, 90.56% מהחוויות של משתמשים אמיתיים ב-https://example.com
עמדו בקריטריונים לLCP טוב, ושערך ה-LCP המשוער של האחוזון ה-75 היה 1,600ms. קצב הצמיחה הזה נמוך מעט מהחודשים הקודמים.
יש ארבע טבלאות מוטמעות:
metrics_summary
- מדדים מרכזיים לפי חודש ומקור
device_summary
- מדדים מרכזיים לפי חודש, מקור וסוג מכשיר
country_summary
- מדדים מרכזיים לפי חודש, מקור, סוג מכשיר ומדינה
origin_summary
- רשימת כל המקורות שכלולים בקבוצת הנתונים
metrics_summary
הטבלה metrics_summary
מכילה נתונים סטטיסטיים של סיכום לכל מקור וכל מערך נתונים חודשי:
yyyymm
- החודש של תקופת איסוף הנתונים
origin
- כתובת ה-URL של מקור האתר
rank
- דירוג גס של פופולריות (נכון למרץ 2021)
[small|medium|large]_cls
- חלק מהתנועה לפי ערכי הסף של CLS
[fast|avg|slow]_<metric>
- חלק מהתנועה לפי ערכי סף ביצועים
p75_<metric>
- ערך האחוזון ה-75 של מדדי הביצועים (אלפיות שנייה)
notification_permission_[accept|deny|ignore|dismiss]
- היחס בין התנהגויות של הרשאות לשליחת התראות
[desktop|phone|tablet]Density
- חלק מהתנועה לפי גורם צורה
[_4G|_3G|_2G|slow2G|offline]Density
- חלק מהתנועה לפי סוג החיבור בפועל
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- החלק של סוגי הניווט
device_summary
הטבלה device_summary
מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary
יש:
device
- גורם הצורה של המכשיר
country_summary
הטבלה country_summary
מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary
יש:
country_code
- קוד מדינה בן שתי אותיות
device
- גורם הצורה של המכשיר
origin_summary
הטבלה origin_summary
מכילה רשימה של כל המקורות במערך הנתונים של CrUX. היא מתעדכנת מדי חודש ברשימה העדכנית ביותר של המקורות במערך הנתונים, ויש לה עמודה אחת: origin
.
מערך נתונים ניסיוני
הטבלאות במערך הנתונים הניסיוני הן עותקים מדויקים של טבלאות YYYYMM
שמוגדרות כברירת מחדל, אבל הן משתמשות בתכונות מתקדמות יותר של BigQuery, כמו חלוקה למחיצות וקיבוץ, שמאפשרות לכתוב שאילתות מהירות יותר, פשוטות יותר וזולות יותר.
country
מערך הנתונים experimental.country
מכיל נתונים מצטברים ממערכות הנתונים country_CC
עם עמודה נוספת yyyymm
לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם הוספה של העמודות date ו-country_code
. כך אפשר להריץ שאילתות השוואה ברמת המדינה לאורך זמן בלי למזג את הטבלאות החודשיות.
global
מערך הנתונים experimental.global
מכיל נתונים מצטברים ממערך הנתונים all
עם עמודה נוספת yyyymm
לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות, עם הוספת התאריך. כך אפשר להריץ שאילתות השוואה לאורך זמן בלי למזג את הטבלאות החודשיות.