इस पेज का अनुवाद Cloud Translation API से किया गया है.

BigQuery की CrUX रिपोर्ट में रैंक की तीव्रता जोड़ना

Johannes Henkel

Barry Pollard

फ़रवरी 2021 के डेटासेट से, हम BigQuery में CrUX रिपोर्ट में एक एक्सपेरिमेंटल मेट्रिक जोड़ रहे हैं. इससे ऑरिजिन की लोकप्रियता का पता चलता है. जैसे, सबसे लोकप्रिय 1 हज़ार ऑरिजिन, सबसे लोकप्रिय 10 हज़ार ऑरिजिन, सबसे लोकप्रिय 1 लाख ऑरिजिन वगैरह.

आइए, देखते हैं कि इसका इस्तेमाल कैसे किया जा सकता है:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

पंक्ति	rank_magnitude	num_origins
1	1,000	1,000
2	10,000	9,000
3	1,00,000	90,000
4	1,000,000	9,00,000
15	10,000,000	7,264,371

फ़रवरी 2021 के ग्लोबल डेटा सेट के लिए, हमें पांच बकेट मिलती हैं. जैसा कि उम्मीद थी, पहली पंक्ति में, हमें 1,000 ऑरिजिन दिखते हैं जिनकी रैंकिंग 1,000 है. ये हमारी मेट्रिक के हिसाब से, सबसे लोकप्रिय 1,000 ऑरिजिन हैं. दूसरी पंक्ति में यह जानकारी दिख सकती है कि टॉप 10 हज़ार सेट में सिर्फ़ 9 हज़ार ऑरिजिन हैं. ऐसा इसलिए है, क्योंकि पहली पंक्ति में मौजूद ऑरिजिन भी टॉप 10 हज़ार सेट का हिस्सा हैं. सबसे ज़्यादा 10 हज़ार ऑरिजिन चुनने के लिए, क्वेरी करते समय, आपको experimental.popularity.rank <= 10000 बताना होगा.

डेटासेट में, देश के हिसाब से रैंक का मैग्नीट्यूड भी शामिल होता है. उदाहरण के लिए, इस क्वेरी से जर्मनी में सबसे ज़्यादा लोकप्रिय 10 हज़ार ऑरिजिन की सूची मिलती है.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

लोकप्रियता की हमारी नई मेट्रिक की क्षमता के बारे में जानने के लिए, देखें कि फ़र्स्ट कॉन्टेंटफ़ुल पेंट मेट्रिक (एफ़सीपी) के हिसाब से, वेब के लोकप्रियता सेगमेंट अलग-अलग कैसे हैं. इस क्वेरी के लिए, हम एक सेकंड को तेज़ उपयोगकर्ता अनुभव मानते हैं.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

experimental.popularity.rank <= 1,000 वाले ऑरिजिन के लिए, क्वेरी 1,000 मिलीसेकंड से कम की एफ़सीपी मेट्रिक वैल्यू के लिए, सभी हिस्टोग्राम बकेट डेंसिटी को जोड़ती है और उसे ऑरिजिन की संख्या से divide करती है. इसका मतलब है कि यह सबसे लोकप्रिय 1,000 ऑरिजिन के लिए, तेज़ एफ़सीपी लोड के औसत प्रतिशत का हिसाब लगाती है. इस क्वेरी में, सभी ऑरिजिन का वज़न एक जैसा होता है. इसलिए, यह क्वेरी पूरी तरह सही नहीं है. हालांकि, आइए देखें कि क्या रैंक के लेवल में बदलाव करने पर नतीजा बदलता है. इसके लिए, where क्लॉज़ में बदलाव करके, experimental.popularity.rank <= 10000 तय करें. हम ऐसा 10 हज़ार, 1 लाख वगैरह के लिए करते हैं:

ऑरिजिन की संख्या के हिसाब से रैंक	ऑरिजिन के हिसाब से, एक सेकंड से कम एफ़सीपी का औसत प्रतिशत
1.000	53.6%
10,000	49.6%
1,00,000	45.9%
1,000,000	43.2%
10,000,000	39.9%

इससे पता चलता है कि वेब पर तेज़ी से लोड होने वाले पेज ज़्यादा लोकप्रिय होते हैं.

अक्टूबर 2022 के डेटासेट में, इसे आधी रैंक के हिसाब से बांटा गया था. इस डेटासेट के लिए पहली क्वेरी को फिर से चलाने पर, हर रैंक मैग्नीट्यूड में आधे चरण और ऑरिजिन की संख्या दिखती है::

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude

पंक्ति	rank_magnitude	num_origins
1	1,000	1,000
2	5,000	4,000
3	10,000	5,000
4	50,000	40,000
5	1,00,000	50,000
6	5,00,000	400,000
7	1,000,000	5,00,000
8	5,000,000	4,000,000
9	10,000,000	5,000,000
10	50,000,000	7,637,195

BigQuery पर CrUX का इस्तेमाल करने के बारे में ज़्यादा जानें. साथ ही, ज़्यादा उदाहरण वाली क्वेरी के लिए, CrUX कुकबुक ब्राउज़ करें. अगर आप चाहें, तो अपनी क्वेरी शेयर करें और हमें बताएं कि आपको क्या मिला.