जानें कि BigQuery में CrUX डेटा को कैसे व्यवस्थित किया जाता है.
परिचय
Chrome UX रिपोर्ट (CrUX) का रॉ डेटा, BigQuery पर उपलब्ध है. यह Google Cloud पर होस्ट किया जाने वाला डेटाबेस है.
BigQuery पर CrUX की मदद से, उपयोगकर्ता सीधे 2017 से लेकर अब तक के पूरे डेटासेट की क्वेरी कर सकते हैं. उदाहरण के लिए, ट्रेंड का विश्लेषण करने, वेब टेक्नोलॉजी और बेंचमार्क डोमेन की तुलना करने के लिए.
इस डेटा को हर महीने की रिलीज़ और कई खास जानकारी वाली टेबल के हिसाब से तैयार किया जाता है. इससे डेटा को आसानी से ऐक्सेस किया जा सकता है.
BigQuery डेटा, CrUX डैशबोर्ड का आधार है. इसकी मदद से, एसक्यूएल क्वेरी लिखे बिना इस डेटा को विज़ुअलाइज़ किया जा सकता है.
डेटासेट ऐक्सेस करना
BigQuery का इस्तेमाल करने के लिए, आपके पास Google Cloud खाता और एसक्यूएल की बुनियादी जानकारी होनी चाहिए. BigQuery पर मौजूद CrUX डेटासेट को फ़्री टीयर की सीमाओं तक ऐक्सेस और एक्सप्लोर किया जा सकता है. इसका रिन्यूअल हर महीने होता है और इसे BigQuery उपलब्ध कराता है. इसके अलावा, Google Cloud के नए उपयोगकर्ताओं को साइन अप क्रेडिट मिल सकता है. इससे उन्हें बिना किसी शुल्क के मिलने वाले टीयर के बाद के शुल्कों को चुकाने में मदद मिलेगी. ध्यान दें कि Google Cloud प्रोजेक्ट के लिए क्रेडिट कार्ड दिया जाना ज़रूरी है. इस बारे में ज़्यादा जानने के लिए, मुझे क्रेडिट कार्ड देने की ज़रूरत क्यों है? सेक्शन देखें.
अगर पहली बार BigQuery का इस्तेमाल किया जा रहा है, तो प्रोजेक्ट सेट अप करने के लिए यह तरीका अपनाएं:
- Google Cloud Console पर, प्रोजेक्ट बनाएं पर जाएं.
- अपने नए प्रोजेक्ट को "मेरी Chrome UX रिपोर्ट" जैसा नाम दें और 'बनाएं' पर क्लिक करें.
- अगर कहा जाए, तो अपनी बिलिंग जानकारी दें.
- BigQuery पर CrUX डेटासेट पर जाएं
अब डेटासेट से क्वेरी करने का समय आ गया है.
प्रोजेक्ट को मैनेज करना
BigQuery पर CrUX डेटा, अगले महीने के दूसरे मंगलवार को रिलीज़ किया जाता है. हर महीने की रिपोर्ट, chrome-ux-report.all
में नई टेबल के तौर पर रिलीज़ की जाती है. इसमें कई मेटालाइज़ की गई टेबल भी होती हैं, जो हर महीने के आंकड़ों की खास जानकारी देती हैं.
- `chrome-ux-report
पूरी जानकारी देने वाली टेबल स्कीमा
हर देश के लिए रॉ टेबल और all
डेटासेट, साल और महीने के हिसाब से दिए गए हैं.
रॉ टेबल
रॉ टेबल का स्कीमा इस तरह का होता है:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
मटेरियलाइज़्ड टेबल स्कीमा
मेटालाइज़ की गई टेबल, कई मुख्य डाइमेंशन के हिसाब से समरी डेटा को आसानी से ऐक्सेस करने के लिए उपलब्ध कराई जाती हैं. कोई हिस्टोग्राम नहीं दिया जाता है. इसके बजाय, परफ़ॉर्मेंस के डेटा को परफ़ॉर्मेंस के आकलन और 75वें पर्सेंटाइल की वैल्यू के हिसाब से, फ़्रैक्शन में एग्रीगेट किया जाता है. इस उदाहरण में, metrics_summary
टेबल की उदाहरण पंक्तियों का एक सेट दिखाया गया है:
yyyymm | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9,209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
इससे पता चलता है कि 202204 डेटासेट में, https://example.com
पर 90.56% असल उपयोगकर्ता अनुभव, अच्छे एलसीपी की शर्तों को पूरा करते हैं. साथ ही, 75वें पर्सेंटाइल के हिसाब से एलसीपी की वैल्यू 1,600 मिलीसेकंड थी. यह पिछले महीनों की तुलना में थोड़ा कम है.
चार मटेरियलाइज़्ड टेबल दी गई हैं:
metrics_summary
- महीने और ऑरिजिन के हिसाब से मुख्य मेट्रिक
device_summary
- महीने, शुरुआत की जगह, और डिवाइस टाइप के हिसाब से मुख्य मेट्रिक
country_summary
- महीने, शुरुआत की जगह, डिवाइस के टाइप, और देश के हिसाब से मुख्य मेट्रिक
origin_summary
- डेटासेट में शामिल सभी ऑरिजिन की सूची
metrics_summary
metrics_summary
टेबल में, हर ऑरिजिन और हर महीने के डेटासेट की खास जानकारी वाले आंकड़े होते हैं:
yyyymm
- डेटा इकट्ठा करने की अवधि का महीना
origin
- साइट के ऑरिजिन का यूआरएल
rank
- लोकप्रियता की अनुमानित रैंकिंग (मार्च 2021 तक)
[small|medium|large]_cls
- सीएलएस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
[fast|avg|slow]_<metric>
- परफ़ॉर्मेंस थ्रेशोल्ड के हिसाब से ट्रैफ़िक का हिस्सा
p75_<metric>
- परफ़ॉर्मेंस मेट्रिक का 75वां पर्सेंटाइल वैल्यू (मिलीसेकंड)
notification_permission_[accept|deny|ignore|dismiss]
- सूचना की अनुमति से जुड़ी गतिविधियों का हिस्सा
[desktop|phone|tablet]Density
- डिवाइस के नाप या आकार के हिसाब से ट्रैफ़िक का हिस्सा
[_4G|_3G|_2G|slow2G|offline]Density
- बेहतर कनेक्शन टाइप के हिसाब से ट्रैफ़िक का हिस्सा
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- नेविगेशन टाइप का हिस्सा
device_summary
device_summary
टेबल में महीने, शुरुआत की जगह, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े होते हैं. metrics_summary
कॉलम के अलावा, ये भी शामिल हैं:
device
- डिवाइस का डिवाइस का नाप या आकार
country_summary
country_summary
टेबल में, महीने, ऑरिजिन, देश, और डिवाइस के हिसाब से एग्रीगेट किए गए आंकड़े शामिल होते हैं. metrics_summary
कॉलम के अलावा, ये भी शामिल हैं:
country_code
- दो अक्षर वाला देश कोड
device
- डिवाइस का डिवाइस का नाप या आकार
origin_summary
origin_summary
टेबल में CrUX डेटासेट में दिए गए सभी ऑरिजिन की सूची मौजूद होती है. इसे डेटासेट में मौजूद ऑरिजिन की सबसे नई सूची के साथ हर महीने अपडेट किया जाता है. इसमें एक कॉलम होता है: origin
.
प्रयोग के लिए बनाया गया डेटासेट
प्रयोग के तौर पर इस्तेमाल किए जा रहे डेटासेट में मौजूद टेबल, डिफ़ॉल्ट YYYYMM
टेबल की कॉपी होती हैं. हालांकि, इनमें BigQuery की पार्टिशन और क्लस्टरिंग जैसी नई और बेहतर सुविधाओं का इस्तेमाल किया जाता है. इनकी मदद से, ज़्यादा तेज़ी से, आसानी से, और कम खर्च में क्वेरी लिखी जा सकती हैं.
country
experimental.country
डेटासेट में, country_CC
डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm
कॉलम होता है. यह स्कीमा, तारीख और country_code
कॉलम के साथ रॉ टेबल की तरह होता है. इसकी मदद से, समय के साथ देश-लेवल पर तुलना की जा सकती है. इसके लिए, महीने वाली टेबल को जोड़ने की ज़रूरत नहीं है.
global
experimental.global
डेटासेट में, all
डेटासेट का इकट्ठा किया गया डेटा होता है. साथ ही, इसमें डेटासेट की तारीख के लिए एक अतिरिक्त yyyymm
कॉलम होता है. यह स्कीमा, तारीख के साथ रॉ टेबल की तरह होता है. इसकी मदद से, महीने के हिसाब से टेबल को जोड़े बिना, समय के साथ-साथ क्वेरी को एक्ज़ीक्यूट किया जा सकता है.