BigQuery की CrUX रिपोर्ट में रैंक की तीव्रता जोड़ना

फ़रवरी 2021 के डेटासेट की शुरुआत से, हम BigQuery की CrUX रिपोर्ट में एक्सपेरिमेंट के तौर पर उपलब्ध मेट्रिक जोड़ रहे हैं. इसकी मदद से, बड़े पैमाने पर मिले ऑरिजिन की लोकप्रियता को अलग-अलग कैटगरी के हिसाब से अलग-अलग दिखाया जा सकता है: टॉप एक हज़ार ऑरिजिन, टॉप 10 हज़ार, टॉप 100 हज़ार, टॉप 10 लाख, ...

आइए, देखते हैं कि यह कैसा काम करता है:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
पंक्ति rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 1,00,000 90,000
4 10,00,000 9,00,000
15 10,000,000 72,64,371

फ़रवरी 2021 के ग्लोबल डेटा सेट के लिए, हमें पांच बकेट मिलती हैं. उम्मीद के मुताबिक, पहली पंक्ति में, हमने देखा है कि ऐसे 1,000 मूल हैं जिनकी रैंक मैग्निट्यूड 1000 है - सबसे ज़्यादा 1k लोकप्रिय ऑरिजिन के बारे में ज़्यादा जानें. पंक्ति 2 आश्चर्यचकित लग सकती है, जिसका अर्थ है कि टॉप 10 हज़ार सेट में सिर्फ़ 9 हज़ार ऑरिजिन हों; ऐसा इसलिए है, क्योंकि पहली पंक्ति के ऑरिजिन भी टॉप 10 हज़ार सेट का हिस्सा हैं. टॉप 10 हज़ार ऑरिजिन चुनने के लिए, किसी एक क्वेरी करते समय Experiments.popularity.rank <= 10000 दर्ज करें.

इस डेटासेट में, अलग-अलग देशों के हिसाब से रैंक का मैग्निट्यूड भी शामिल है. उदाहरण के लिए, यह क्वेरी उन 10 हज़ार मूल की सूची बनाती है जो जर्मनी में सबसे लोकप्रिय हैं.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

लोकप्रियता की नई मेट्रिक की संभावना के बारे में जानने के लिए, चलिए देखते हैं कि लोकप्रियता कैसी है वेब के सेगमेंट, फ़र्स्ट कॉन्टेंटफ़ुल पेंट मेट्रिक (एफ़सीपी) के हिसाब से अलग-अलग होते हैं. इस क्वेरी के लिए, हम 1 सेकंड का तेज़ उपयोगकर्ता अनुभव मानते हैं.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

experimental.popularity.rank <= 1000 वाले ऑरिजिन के लिए, क्वेरी में सभी का योग होता है एफ़सीपी मेट्रिक की वैल्यू के लिए हिस्टोग्राम बकेट डेंसिटी, 1000 मि॰से॰ से कम और डिवाइडर इसे मूल की संख्या के आधार पर खोजा जाता है. इसका मतलब है कि यह एक हज़ार सबसे लोकप्रिय ऑरिजिन के लिए तेज़ी से एफ़सीपी लोड होती है. इस क्वेरी में, सभी ऑरिजिन के पास वज़न कितना है, इसलिए बेशक यह पूरी तरह से सही नहीं है. हालाँकि, आइए देखते हैं कि वह जगह की वैल्यू को बदलकर, रैंक मैग्निट्यूड को बदलने के प्रति संवेदनशील होता है Experiments.popularity.rank <= 10000 दर्ज करें. हम यह 10k, 100k वगैरह के लिए करते हैं चालू है:

ऑरिजिन की रैंक का दायरा एफ़सीपी का प्रतिशत < 1 सेकंड, ऑरिजिन के हिसाब से औसत
1.000 53.6%
10,000 49.6%
1,00,000 45.9%
10,00,000 43.2%
10,000,000 39.9%

इससे पता चलता है कि वेब पर तेज़ी से उपयोगकर्ता अनुभव पाने का मतलब है कि उसका ज़्यादा लोकप्रिय होना.

अक्टूबर 2022 के डेटासेट में, इसे आधा रैंक वाले चरणों के हिसाब से बांटा गया. इस डेटासेट के लिए पहली क्वेरी को फिर से चलाने से आधे चरण और हर रैंक मैग्निट्यूड में ऑरिजिन की संख्या दिखती है::

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
पंक्ति rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 1,00,000 50,000
6 5,00,000 400,000
7 10,00,000 5,00,000
8 50,00,000 40,00,000
9 10,000,000 50,00,000
10 5,00,00,000 76,37,195

BigQuery पर CrUX का इस्तेमाल करने के बारे में ज़्यादा जानें. साथ ही, क्वेरी के उदाहरण देखने के लिए, CrUX कुकबुक को ब्राउज़ करें. अगर आप चाहें, तो अपनी क्वेरी शेयर करें और हमें बताएं कि आपको क्या मिला.