דף זה תורגם על ידי Cloud Translation API.

הוספה של מידת הדירוג לדוח CrUX ב-BigQuery

Johannes Henkel

Barry Pollard

החל ממערך הנתונים של פברואר 2021, אנחנו מוסיפים מדד ניסיוני לדוח CrUX ב-BigQuery שמבדיל בין רמות הפופולריות של מקורות לפי סדר גודל: 1,000 המקורות המובילים, 10,000 המקורות המובילים, 100,000 המקורות המובילים, 1,000,000 המקורות המובילים וכו'.

בואו נראה איך זה נראה בפועל:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

שורה	rank_magnitude	num_origins
1	1,000	1,000
2	10,000	9,000
3	100,000	90,000
4	1,000,000	900,000
15	10,000,000	7,264,371

עבור קבוצת הנתונים הגלובלית של פברואר 2021, אנחנו מקבלים 5 קטגוריות. כצפוי, בשורה 1 אנחנו רואים שיש 1,000 מקורות עם עוצמת דירוג 1,000 – 1,000 המקורות הפופולריים ביותר לפי המדד שלנו. שורה 2 עשויה להיראות מפתיעה, כי היא מציינת שיש רק 9,000 מקורות בקבוצה של 10,000 המקורות המובילים. הסיבה לכך היא שהמקורות בשורה 1 הם גם חלק מקבוצת 10,000 המקורות המובילים. כדי לבחור את 10,000 המקורות המובילים, צריך לציין את experimental.popularity.rank <= 10000 בשאילתה.

מערך הנתונים מכיל גם את עוצמת הדירוג הספציפית למדינה. לדוגמה, השאילתה הזו מציגה את 10,000 המקורות הפופולריים ביותר בגרמניה.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

כדי להבין את הפוטנציאל של המדד החדש שלנו למדידת הפופולריות, נראה איך קטעי הפופולריות באינטרנט שונים מבחינת מדד ההצגה הראשונית של תוכן (FCP). לצורך השאילתה הזו, אנחנו מתייחסים לשנייה אחת כחוויית משתמש מהירה.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

לגבי מקורות עם experimental.popularity.rank <= 1000, השאילתה מסכמת את כל הצפיפויות של הקטגוריות בתרשים ההיסטוגרמה לערכים של מדד FCP שקטנים מ-1,000ms ומחלקת את הערך הזה במספר המקורות – כלומר, היא מחשבת את האחוז הממוצע של עומסי FCP מהירים ב-1,000 המקורות הפופולריים ביותר. בשאילתה הזו, לכל המקורות יש משקל שווה, ולכן אפשר לטעון שהיא לא מושלמת. אבל נבדוק אם התוצאה רגישת לשינוי עוצמת הדירוג. לשם כך, נשנה את תנאי התנאי כך שיהיה experimental.popularity.rank <= 10000. אנחנו עושים זאת עבור 10,000, 100,000 וכן הלאה:

דירוג עוצמת המקורות	אחוז ה-FCP ‏ < שנייה אחת, בממוצע על פני מקורות
1.000	53.6%
10,000	49.6%
100,000	45.9%
1,000,000	43.2%
10,000,000	39.9%

הנתון הזה מציין שיש קורלציה בין חוויית משתמש מהירה יותר באינטרנט לבין פופולריות גבוהה יותר.

במערך הנתונים של אוקטובר 2022, הנתונים האלה פוצלו עוד יותר לפי שלבי חצי דירוג. הרצת השאילתה הראשונה מחדש לגבי מערך הנתונים הזה מציגה את שלבי הביניים ואת מספר המקורות בכל רמת דירוג:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

שורה	rank_magnitude	num_origins
1	1,000	1,000
2	5,000	4,000
3	10,000	5,000
4	50,000	40,000
5	100,000	50,000
6	500,000	400,000
7	1,000,000	500,000
8	5,000,000	4,000,000
9	10,000,000	5,000,000
10	50,000,000	7,637,195

מידע נוסף על שימוש ב-CrUX ב-BigQuery זמין באוסף הפתרונות של CrUX, שבו אפשר למצוא שאילתות לדוגמה נוספות. אפשר לשתף את השאילתות שלכם ולספר לנו מה מצאתם.

הוספה של מידת הדירוג לדוח CrUX ב-BigQuery קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

הוספה של מידת הדירוג לדוח CrUX ב-BigQuery