BigQuery की CrUX रिपोर्ट में रैंक की तीव्रता जोड़ना

फ़रवरी 2021 के डेटासेट से, हम BigQuery में CrUX रिपोर्ट में एक एक्सपेरिमेंटल मेट्रिक जोड़ रहे हैं. इससे, ऑरिजिन की लोकप्रियता का पता चलता है. जैसे, सबसे लोकप्रिय 1 हज़ार ऑरिजिन, सबसे लोकप्रिय 10 हज़ार ऑरिजिन, सबसे लोकप्रिय 1 लाख ऑरिजिन, ...

आइए, देखते हैं कि यह सुविधा कैसे काम करती है:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
पंक्ति rank_magnitude num_origins
1 1,000 1,000
2 10,000 9,000
3 1,00,000 90,000
4 1,000,000 9,00,000
15 10,000,000 72,64,371

फ़रवरी 2021 के ग्लोबल डेटा सेट के लिए, हमें पांच बकेट मिलती हैं. जैसा कि उम्मीद थी, पहली पंक्ति में, हमें 1,000 ऑरिजिन दिखते हैं जिनकी रैंकिंग 1,000 है. ये हमारी मेट्रिक के हिसाब से, सबसे लोकप्रिय 1,000 ऑरिजिन हैं. पंक्ति 2 हैरान करने वाली लग सकती है. इससे पता चलता है कि टॉप 10 हज़ार सेट में सिर्फ़ नौ हज़ार ऑरिजिन वाले हैं. ऐसा इसलिए है, क्योंकि पहली पंक्ति में दिए गए ऑरिजिन, टॉप 10 हज़ार सेट का भी हिस्सा हैं. टॉप 10 हज़ार ऑरिजिन चुनने के लिए, क्वेरी करते समय किसी व्यक्ति कोपुष्टि करने के लिए ऐक्सपेरिमेंटल.popularity.rank <= 10000 बताना होगा.

डेटासेट में, देश के हिसाब से रैंक का मैग्नीट्यूड भी शामिल होता है. उदाहरण के लिए, इस क्वेरी में उन 10 हज़ार ऑरिजिन की सूची दी गई है जो जर्मनी में सबसे ज़्यादा लोकप्रिय हैं.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

लोकप्रियता की नई मेट्रिक की संभावनाओं के बारे में जानने के लिए, देखें कि वेब पर लोकप्रियता के सेगमेंट, फ़र्स्ट कॉन्टेंटफ़ुल पेंट मेट्रिक (एफ़सीपी) के हिसाब से कैसे अलग-अलग होते हैं. इस क्वेरी के लिए, हम एक सेकंड को तेज़ उपयोगकर्ता अनुभव मानते हैं.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

experimental.popularity.rank <= 1,000 वाले ऑरिजिन के लिए, क्वेरी 1,000 मिलीसेकंड से कम की एफ़सीपी मेट्रिक वैल्यू के लिए, सभी हिस्टोग्राम बकेट डेंसिटी को जोड़ती है और उसे ऑरिजिन की संख्या से divide करती है. इसका मतलब है कि यह सबसे लोकप्रिय 1,000 ऑरिजिन के लिए, तेज़ एफ़सीपी लोड के औसत प्रतिशत का हिसाब लगाती है. इस क्वेरी में, सभी ऑरिजिन का वज़न एक जैसा होता है. इसलिए, यह क्वेरी पूरी तरह सही नहीं है. हालांकि, आइए देखें कि क्या रैंक के लेवल में बदलाव करने पर नतीजा बदलता है. इसके लिए, where क्लॉज़ में बदलाव करके, experimental.popularity.rank <= 10000 तय करें. हम ऐसा 10 हज़ार, 1 लाख वगैरह के लिए करते हैं:

ऑरिजिन की रैंक की तीव्रता ऑरिजिन के हिसाब से औसत एफ़सीपी < 1s का प्रतिशत
1.000  53.6%
10,000 49.6%
1,00,000 45.9%
1,000,000 43.2%
10,000,000 39.9%

इससे पता चलता है कि वेब पर तेज़ी से लोड होने वाले पेज ज़्यादा लोकप्रिय होते हैं.

अक्टूबर 2022 के डेटासेट में, इसे आधी रैंक के हिसाब से बांटा गया था. इस डेटासेट के लिए पहली क्वेरी को फिर से चलाने पर, हर रैंक मैग्नीट्यूड में आधे चरण और ऑरिजिन की संख्या दिखती है::

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
पंक्ति rank_magnitude num_origins
1 1,000 1,000
2 5,000 4,000
3 10,000 5,000
4 50,000 40,000
5 1,00,000 50,000
6 5,00,000 400,000
7 1,000,000 5,00,000
8 5,000,000 4,000,000
9 10,000,000 5,000,000
10 50,000,000 7,637,195

BigQuery पर CrUX का इस्तेमाल करने के बारे में ज़्यादा जानें. साथ ही, ज़्यादा उदाहरण वाली क्वेरी के लिए, CrUX कुकबुक ब्राउज़ करें. अगर आप चाहें, तो अपनी क्वेरी शेयर करें और हमें बताएं कि आपको क्या मिला.