כאן אפשר ללמוד על המבנה של נתוני CrUX ב-BigQuery.
מבוא
הנתונים הגולמיים שמאחורי דוח חוויית המשתמש ב-Chrome (CrUX) זמינים ב-BigQuery, מסד נתונים שמתארח ב-Google Cloud.
CrUX ב-BigQuery מאפשר למשתמשים לבצע שאילתות ישירות על מערך הנתונים המלא החל מ-2017, לדוגמה כדי לנתח מגמות, להשוות טכנולוגיות אינטרנט ודומיינים של נקודות השוואה.
הנתונים בנויים לפי גרסה חודשית, וגם לפי מספר טבלאות סיכום, כדי לאפשר גישה פשוטה לשאילתות הנתונים.
נתוני BigQuery הם הבסיס למרכז הבקרה של CrUX, שמאפשר להציג את הנתונים האלה באופן חזותי בלי לכתוב שאילתות SQL.
גישה למערך הנתונים
כדי להשתמש ב-BigQuery צריך חשבון Google Cloud וידע בסיסי ב-SQL. אפשר לגשת אל מערך הנתונים של CrUX ב-BigQuery ולבדוק את מכסת השימוש בו, בהתאם למגבלות של תוכנית ללא תשלום, שמתחדשת מדי חודש ומסופקת על ידי BigQuery. בנוסף, משתמשים חדשים ב-Google Cloud עשויים להיות זכאים לזיכוי הרשמה כדי לכסות הוצאות מעבר לתוכנית ללא תשלום. הערה: צריך לספק כרטיס אשראי לפרויקט ב-Google Cloud. מידע נוסף זמין במאמר למה צריך לספק כרטיס אשראי?
אם זו הפעם הראשונה שאתם משתמשים ב-BigQuery, כדי להגדיר פרויקט יש לבצע את השלבים הבאים:
- עוברים אל Create a Project במסוף Google Cloud.
- נותנים שם לפרויקט החדש, למשל 'דוח חוויית המשתמש שלי ב-Chrome' ולוחצים על 'יצירה'.
- אם מופיעה בקשה, מציינים את נתוני החיוב.
- עוברים אל מערך הנתונים של CrUX ב-BigQuery
עכשיו אתם מוכנים להתחיל להריץ שאילתות על מערך הנתונים.
ארגון הפרויקט
נתוני CrUX ב-BigQuery מתפרסמים ביום שלישי השני של החודש הבא. כל חודש מופיע כטבלה חדשה בקטע chrome-ux-report.all
. קיימות גם מספר טבלאות מהותיות שמספקות סיכום של הנתונים הסטטיסטיים בכל חודש.
- 'chrome-ux-report'
סכימת טבלאות מפורטת
הטבלאות הגולמיות לכל מדינה ומערך הנתונים all
מוצגות לפי שנה וחודש.
טבלאות גולמיות
הטבלאות הגולמיות כוללות את הסכימה הבאה:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
first_input
delay
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
סכימת טבלה ממוחשבת
המערכת מספקת טבלאות מורכבות לצורך גישה קלה יותר לנתוני סיכום לפי כמה ממאפייני המפתח. לא מסופקות היסטוגרמות, במקום זאת נתוני הביצועים נצברים לשברים לפי הערכת הביצועים והערך באחוזון ה-75. בדוגמה הזו מוצגת קבוצת שורות לדוגמה מהטבלה metrics_summary
:
yyyymm | מקור | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1,600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1,400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
ניתן לראות שבמערך הנתונים של שנת 202204, 90.56% מחוויות המשתמשים בפועל ב-https://example.com
עמדו בקריטריונים של LCP טוב, ושערך ה-LCP באחוזון ה-75 היה 1,600 אלפיות השנייה. זו תקופה מעט איטית יותר מהחודשים הקודמים.
מוצגות ארבע טבלאות מורכבות:
metrics_summary
- מדדים עיקריים לפי חודש ומקור
device_summary
- מדדים עיקריים לפי חודש, מקור וסוג מכשיר
country_summary
- מדדים עיקריים לפי חודש, מקור, סוג המכשיר ומדינה
origin_summary
- רשימה של כל המקורות הכלולים במערך הנתונים
metrics_summary
הטבלה metrics_summary
מכילה סיכום של נתונים סטטיסטיים לכל מקור ולכל מערך נתונים חודשי:
yyyymm
- החודש של תקופת איסוף הנתונים
origin
- כתובת ה-URL של מקור האתר
rank
- דירוג פופולריות משוער (נכון למרץ 2021)
[small|medium|large]_cls
- החלק היחסי של התנועה לפי ערכי סף ב-CLS
[fast|avg|slow]_<metric>
- החלק היחסי של התנועה לפי ערכי סף לביצועים
p75_<metric>
- ערך האחוזון ה-75 של מדדי ביצועים (אלפיות שנייה)
notification_permission_[accept|deny|ignore|dismiss]
- החלק היחסי של ההתנהגויות ההרשאות לשליחת התראות
[desktop|phone|tablet]Density
- חלק של התנועה לפי גורם צורה
[_4G|_3G|_2G|slow2G|offline]Density
- חלוקת התנועה לפי סוג החיבור האפקטיבי
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- חלק של סוגי הניווט
device_summary
הטבלה device_summary
מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary
יש:
device
- גורם הצורה של המכשיר
country_summary
הטבלה country_summary
מכילה נתונים סטטיסטיים מצטברים לפי חודש, מקור, מדינה ומכשיר. בנוסף לעמודות metrics_summary
יש:
country_code
- קוד מדינה בן שתי אותיות
device
- גורם הצורה של המכשיר
origin_summary
הטבלה origin_summary
מכילה רשימה של כל המקורות במערך הנתונים של CrUX. היא מתעדכנת מדי חודש ומופיעה בה הרשימה העדכנית ביותר של המקורות במערך הנתונים, והיא כוללת עמודה אחת: origin
.
מערך נתונים ניסיוני
הטבלאות במערך הנתונים הניסיוני הן עותקים מדויקים של טבלאות ברירת המחדל של YYYYMM
, אבל נעשה בהן שימוש בתכונות חדשות ומתקדמות יותר של BigQuery, כמו חלוקה למחיצות ואשכולות, שמאפשרות לכם לכתוב שאילתות מהירות, פשוטות וזולות יותר.
country
מערך הנתונים experimental.country
מכיל נתונים נצברים ממערכי הנתונים של country_CC
עם עמודה yyyymm
נוספת לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות עם הוספת עמודות התאריך ו-country_code
, וכך מאפשרת לבצע השוואה ברמת המדינה לאורך זמן בלי להצטרף לטבלאות החודשיות.
global
מערך הנתונים experimental.global
מכיל נתונים נצברים ממערך הנתונים all
עם עמודה yyyymm
נוספת לתאריך של מערך הנתונים. הסכימה זהה לטבלאות גולמיות עם הוספת התאריך, כדי לאפשר ביצוע של שאילתות לאורך זמן בלי להצטרף לטבלאות החודשיות.