הוספה של מידת הדירוג לדוח CrUX ב-BigQuery

החל ממערך הנתונים של פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery, שקובע את הפופולריות של המקורות לפי סדרי גודל: 1,000 המקורות המובילים, 10,000 המקורות המובילים, 10,000 המקורות המובילים, ...

בואו נראה איך זה עובד:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
שורה rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 100,000 90,000
4 1,000,000 900,000
15 10,000,000 7,264,371

עבור מערך הנתונים הגלובלי של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כמצופה, בשורה 1 ראינו שיש 1,000 מקורות בגודל 1,000, כלומר 1,000 מקורות מקורות פופולריים לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, וזה סימן לכך הם רק מקורות של 9,000 מבין 10,000 המקורות המובילים. הסיבה לכך היא שהמקורות בשורה 1 גם הוא חלק מקבוצת 10,000 המובילים. כדי לבחור את 10,000 המקורות המובילים, צריך לציין traffic.popularity.rank <= 10000 בזמן ביצוע שאילתה.

מערך הנתונים מכיל גם את היקף הדירוג הספציפי למדינה. לדוגמה, רשימה של 10,000 המקורות הפופולריים ביותר בגרמניה.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

כדי לגעת בפוטנציאל של מדד הפופולריות החדש, נראה את רמת הפופולריות שונים באינטרנט ביחס למדד הצגת תוכן ראשוני (FCP). למטרת השאילתה הזו, שנייה אחת היא מבחינתנו חוויית משתמש מהירה.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

למקורות עם experimental.popularity.rank <= 1000, השאילתה מסכמת את כל צפיפות קטגוריות ההיסטוגרמה של ערכי מדדי FCP שקטנים מ-1,000 אלפיות השנייה, וחלוקה של לפי מספר המקורות – כלומר, היא מחשבת את האחוז הממוצע טעינות FCP מהירות למקורות הפופולריים ביותר של 1,000. בשאילתה הזו, לכל המקורות יש משקל שווה, כך שניתן לומר שזה לא מושלם. אבל בואו נראה הוא רגיש לשינוי סדר הדירוג, על ידי שינוי הסעיף שבו לציין dynamic.popularity.rank <= 10000. אנחנו עושים זאת עבור 10, 000, 000 ב:

היקף הדירוג של המקורות אחוז FCP < 1, בממוצע לפי מקורות
1,000 53.6%
10,000 49.6%
100,000 45.9%
1,000,000 43.2%
10,000,000 39.9%

המשמעות היא שחוויית משתמש מהירה יותר באינטרנט קשורה לפופולריות גבוהה יותר.

במערך הנתונים של אוקטובר 2022, החלוקה הזו מחולקת עוד יותר לפי חצי דירוג. הרצה מחדש של השאילתה הראשונה עבור מערך הנתונים הזה מציגה את חצאי השלבים ואת מספר המקורות בכל גודל של דירוג:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
שורה rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 100,000 50,000
6 500,000 400,000
7 1,000,000 500,000
8 5,000,000 4,000,000
9 10,000,000 5,000,000
10 50,000,000 7,637,195

אתם יכולים לעיין במידע נוסף על השימוש ב-CrUX ב-BigQuery ובספר המתכונים של CrUX לקבלת שאילתות לדוגמה נוספות. אם רוצים, אפשר לשתף שאלות ולספר לנו מה מצאתם.