CrUX के काम करने का तरीका

इस सेक्शन में, CrUX के ज़रिए उपयोगकर्ता अनुभव का डेटा इकट्ठा करने और उसे व्यवस्थित करने के तरीके के बारे में बताया गया है.

ज़रूरी शर्तें

CrUX डेटासेट में, उपयोगकर्ताओं के अलग-अलग अनुभवों का डेटा शामिल होता है. इस डेटा को, पेज-लेवल और ऑरिजिन-लेवल के डिस्ट्रिब्यूशन में इकट्ठा किया जाता है. इस सेक्शन में, उपयोगकर्ताओं के लिए ज़रूरी शर्तें और डेटासेट में शामिल किए जाने वाले पेजों और ऑरिजिन के लिए ज़रूरी शर्तें बताई गई हैं. किसी अनुभव को PageSpeed Insights और CrUX API में उपलब्ध पेज-लेवल के डेटा में शामिल करने के लिए, सभी ज़रूरी शर्तें पूरी होनी चाहिए. ये शर्तें, उपयोगकर्ता, ऑरिजिन और पेज के लिए अलग-अलग हैं. ऐसे अनुभव जो उपयोगकर्ता और ऑरिजिन की ज़रूरी शर्तें पूरी करते हैं, लेकिन पेज की ज़रूरी शर्तें पूरी नहीं करते उन्हें CrUX के सभी डेटा सोर्स में उपलब्ध ऑरिजिन-लेवल के डेटा में शामिल नहीं किया जाता.

अगर समय के साथ पेजों और ऑरिजिन की ज़रूरी शर्तों में बदलाव होता है, तो उन्हें डेटासेट में अपने-आप शामिल या हटाया जाता है. फ़िलहाल, पेजों या ऑरिजिन को डेटासेट में शामिल करने के लिए, मैन्युअल तरीके से सबमिट नहीं किया जा सकता.

सार्वजनिक तौर पर खोजा जा सकता है

CrUX डेटासेट में शामिल किए जाने के लिए, किसी पेज का सार्वजनिक तौर पर खोजा जाना ज़रूरी है.

किसी पेज को सार्वजनिक तौर पर खोजा जा सकता है या नहीं, यह तय करने के लिए, सर्च इंजन के इंडेक्स किए जा सकने की शर्तों का इस्तेमाल किया जाता है.

अगर ऑरिजिन डेटासेट के रूट पेजों के साथ-साथ, इनमें से कोई भी शर्त पूरी होती है, तो पेज, खोजे जा सकने की ज़रूरी शर्त को पूरा नहीं कर सकता:

  • पेज को रीडायरेक्ट के बाद, 200 के अलावा किसी अन्य एचटीटीपी स्टेटस कोड के साथ दिखाया जाता है.
  • पेज को एचटीटीपी X-Robots-Tag: noindex हेडर या इसके बराबर किसी अन्य हेडर के साथ दिखाया जाता है.
  • दस्तावेज़ में एक <meta name="robots" content="noindex"> मेटा टैग या इसके बराबर कोई अन्य टैग शामिल है.

अपनी साइट के इंडेक्सिंग स्टेटस की खास जानकारी पाने के लिए, Google Search Console देखें.

काफ़ी लोकप्रिय

किसी पेज को काफ़ी लोकप्रिय तब माना जाता है, जब उस पर आने वाले लोगों की संख्या तय की गई कम से कम संख्या के बराबर हो. किसी ऑरिजिन को काफ़ी लोकप्रिय तब माना जाता है, जब उसके सभी पेजों पर आने वाले लोगों की संख्या तय की गई कम से कम संख्या के बराबर हो. इस संख्या के बारे में जानकारी नहीं दी जाती. हालांकि, यह संख्या इस तरह से तय की गई है, ताकि शामिल किए गए पेजों के लिए, आंकड़ों के हिसाब से डिस्ट्रिब्यूशन की पुष्टि करने के लिए हमारे पास ज़रूरत के मुताबिक सैंपल मौजूद हों. पेजों और ऑरिजिन के लिए, यह संख्या एक ही है.

ऐसे पेज और ऑरिजिन जो लोकप्रियता के थ्रेशोल्ड को पूरा नहीं करते उन्हें CrUX डेटासेट में शामिल नहीं किया जाता.

ऑरिजिन

ऑरिजिन का मतलब पूरी वेबसाइट होती है. इसे https://www.example.com जैसे यूआरएल से ऐक्सेस किया जा सकता है. किसी ऑरिजिन को CrUX डेटासेट में शामिल करने के लिए, उसे ये दो ज़रूरी शर्तें पूरी करनी होंगी:

  1. सार्वजनिक तौर पर खोजा जा सकता है
  2. काफ़ी लोकप्रिय

यह पुष्टि करने के लिए कि आपका ऑरिजिन खोजा जा सकता है या नहीं, Lighthouse ऑडिट चलाएं और एसईओ कैटगरी के नतीजे देखें. अगर आपका मुख्य पेज, पेज को इंडेक्स होने से रोका गया है या पेज में काम नहीं करने वाला एचटीटीपी स्टेटस कोड है ऑडिट में फ़ेल हो जाता है, तो आपकी साइट को खोजा नहीं जा सकता.

अगर किसी ऑरिजिन को सार्वजनिक तौर पर खोजा जा सकता है, तो उस ऑरिजिन के सभी पेजों पर ज़रूरी शर्तें पूरी करने वाले उपयोगकर्ता के अनुभवों को ऑरिजिन-लेवल पर इकट्ठा किया जाता है. भले ही, अलग-अलग पेजों को खोजा जा सकता हो या नहीं. इन सभी अनुभवों को, ऑरिजिन की लोकप्रियता की ज़रूरी शर्त के तौर पर गिना जाता है.

क्वेरी करने के लिए, ध्यान दें कि CrUX डेटासेट में मौजूद सभी ऑरिजिन, लोअरकेस में होते हैं.

पेज

किसी पेज को CrUX डेटासेट में शामिल करने के लिए, वही ज़रूरी शर्तें लागू होती हैं जो ऑरिजिन के लिए लागू होती हैं:

  1. सार्वजनिक तौर पर खोजा जा सकता है
  2. काफ़ी लोकप्रिय

यह पुष्टि करने के लिए कि कोई पेज खोजा जा सकता है या नहीं, Lighthouse ऑडिट चलाएं और एसईओ कैटगरी के नतीजे देखें. अगर आपका पेज, पेज को इंडेक्स होने से रोका गया है या पेज में काम नहीं करने वाला एचटीटीपी स्टेटस कोड है ऑडिट में फ़ेल हो जाता है, तो उसे खोजा नहीं जा सकता.

अगर किसी पेज को कुछ उपयोगकर्ताओं के लिए सार्वजनिक तौर पर खोजा जा सकता है, लेकिन कुछ मामलों में वह काम न करने वाला एचटीटीपी स्टेटस दिखाता है, तो उन अनुभवों को CrUX में शामिल नहीं किया जाएगा.

आम तौर पर, पेजों के यूआरएल में अतिरिक्त आइडेंटिफ़ायर शामिल होते हैं. इनमें क्वेरी स्ट्रिंग पैरामीटर, जैसे कि ?utm_medium=email और फ़्रैगमेंट, जैसे कि #main शामिल हैं. CrUX डेटासेट में, यूआरएल से इन आइडेंटिफ़ायर को हटा दिया जाता है, ताकि पेज पर उपयोगकर्ता के सभी अनुभवों को एक साथ इकट्ठा किया जा सके. यह उन पेजों के लिए काम का है जो लोकप्रियता के थ्रेशोल्ड को पूरा नहीं करते. ऐसा तब होता है, जब एक ही पेज के लिए यूआरएल के कई अलग-अलग वर्शन मौजूद होते हैं. ध्यान दें कि कुछ मामलों में, ऐसा हो सकता है कि अलग-अलग पेजों के अनुभवों को गलती से एक साथ ग्रुप कर दिया जाए. उदाहरण के लिए, अगर पैरामीटर ?productID=101 और ?productID=102 अलग-अलग पेजों को दिखाते हैं.

CrUX में पेजों को टॉप-लेवल पेज के आधार पर मेज़र किया जाता है. CrUX में, iframe के तौर पर शामिल किए गए पेजों की अलग से रिपोर्ट नहीं की जाती. हालांकि, ये टॉप-लेवल पेज की मेट्रिक में योगदान देते हैं. उदाहरण के लिए, अगर https://www.example.com/page.html में iframe के तौर पर https://www.example.com/frame.html एम्बेड किया गया है, तो CrUX में page.html दिखेगा. हालांकि, इसके लिए ज़रूरी अन्य शर्तें पूरी होनी चाहिए. वहीं, frame.html नहीं दिखेगा. CLS CrUX, Chrome की उपयोगकर्ता अनुभव रिपोर्ट है. हो सकता है कि किसी उपयोगकर्ता को यह भी न पता हो कि यह iframe है. इसलिए, अनुभव को टॉप-लेवल पेज पर मेज़र किया जाता है. ऐसा इसलिए किया जाता है, ताकि यह पता चल सके कि उपयोगकर्ता को यह पेज कैसा दिखता है.

किसी वेबसाइट के आर्किटेक्चर की वजह से, CrUX में उसका डेटा दिखाने का तरीका मुश्किल हो सकता है. उदाहरण के लिए, सिंगल पेज ऐप्लिकेशन (एसपीए), पेजों के बीच नेविगेट करने के लिए, JavaScript पर आधारित रूट ट्रांज़िशन स्कीम का इस्तेमाल कर सकते हैं. इसके लिए, पारंपरिक ऐंकर-आधारित पेज नेविगेशन का इस्तेमाल नहीं किया जाता. उपयोगकर्ता को ये ट्रांज़िशन, नए पेज व्यू के तौर पर दिखते हैं. हालांकि, Chrome और प्लैटफ़ॉर्म के एपीआई के लिए, पूरा अनुभव शुरुआती पेज व्यू से जुड़ा होता है. यह वेब प्लैटफ़ॉर्म के उन एपीआई की एक सीमा है जिन पर CrUX बनाया गया है. ज़्यादा जानकारी के लिए, web.dev पर एसपीए आर्किटेक्चर, वेबसाइट की परफ़ॉर्मेंस से जुड़ी अहम जानकारी को कैसे प्रभावित करते हैं लेख पढ़ें.

उपयोगकर्ता

किसी उपयोगकर्ता के अनुभवों को CrUX डेटासेट में इकट्ठा करने के लिए, उसे ये शर्तें पूरी करनी होंगी:

  1. इस्तेमाल के आंकड़ों की रिपोर्टिंग की सुविधा चालू करना.
  2. अपने ब्राउज़र के इतिहास को सिंक करना.
  3. सिंक करने के लिए लंबा पासवर्ड सेट न करना.
  4. ऐसे प्लैटफ़ॉर्म का इस्तेमाल करना जिस पर यह सुविधा काम करती है.

फ़िलहाल, इन प्लैटफ़ॉर्म पर यह सुविधा काम करती है:

  • Chrome के डेस्कटॉप वर्शन. इनमें Windows, macOS, ChromeOS, और Linux ऑपरेटिंग सिस्टम शामिल हैं.
  • Chrome के Android वर्शन. इनमें कस्टम टैब और WebAPKs का इस्तेमाल करने वाले मोबाइल ऐप्लिकेशन शामिल हैं.

कुछ ऐसे प्लैटफ़ॉर्म हैं जो CrUX डेटासेट को डेटा उपलब्ध नहीं कराते:

  • iOS पर Chrome.
  • WebView का इस्तेमाल करने वाले Android ऐप्लिकेशन.
  • Chromium पर आधारित अन्य ब्राउज़र. जैसे, Microsoft Edge.

Chrome, इन शर्तों को पूरा करने वाले उपयोगकर्ताओं के अनुपात के बारे में डेटा पब्लिश नहीं करता. Chrome में इकट्ठा किए जाने वाले डेटा के बारे में ज़्यादा जानें.

Accelerated Mobile Pages (AMP)

एएमपी का इस्तेमाल करके बनाए गए पेजों को CrUX डेटासेट में, किसी अन्य वेब पेज की तरह ही शामिल किया जाता है. जून 2020 में CrUX के रिलीज़ होने के बाद से, एएमपी कैश का इस्तेमाल करके दिखाए गए और / या एएमपी व्यूअर में रेंडर किए गए पेजों को भी कैप्चर किया जाता है. साथ ही, इन्हें पब्लिशर के पेज के यूआरएल से एट्रिब्यूट किया जाता है.

डेटा क्वालिटी

CrUX में मौजूद डेटा को प्रोसेस किया जाता है, ताकि यह पक्का किया जा सके कि यह आंकड़ों के हिसाब से सटीक हो, अच्छी तरह से स्ट्रक्चर्ड हो, और इस पर क्वेरी करना आसान हो.

फ़िल्टर करना

CrUX डेटासेट को फ़िल्टर किया जाता है, ताकि यह पक्का किया जा सके कि दिखाया गया डेटा, आंकड़ों के हिसाब से मान्य हो. इससे, हो सकता है कि पूरे पेज या ऑरिजिन, डेटासेट में न दिखें.

ऑरिजिन और पेजों पर लागू होने वाली ज़रूरी शर्तों के अलावा, डेटा में मौजूद सेगमेंट के लिए भी फ़िल्टरिंग लागू की जाती है:

डाइमेंशन के अयोग्य कॉम्बिनेशन की वजह से, जिन ऑरिजिन या पेजों के कुल ट्रैफ़िक का 20% से ज़्यादा हिस्सा बाहर कर दिया जाता है उन्हें डेटासेट से पूरी तरह से बाहर कर दिया जाता है.

ग्लोबल-लेवल के डेटासेट में, सभी देशों के उपयोगकर्ताओं के अनुभवों का डेटा शामिल होता है. इसलिए, हो सकता है कि डाइमेंशन के ऐसे कॉम्बिनेशन जो देश के लेवल पर लोकप्रियता की ज़रूरी शर्तों को पूरा नहीं करते उन्हें ग्लोबल लेवल पर शामिल किया जाए. हालांकि, इसके लिए यह ज़रूरी है कि उनकी लोकप्रियता काफ़ी हो.

फ़ज़िंग

डेटासेट में, थोड़ी मात्रा में रैंडमनेस लागू की जाती है, ताकि संवेदनशील डेटा को रिवर्स-इंजीनियरिंग से बचाया जा सके. जैसे, ट्रैफ़िक की कुल मात्रा. इससे, कुल आंकड़ों की सटीकता पर कोई असर नहीं पड़ता.

स्पष्टता

CrUX डेटासेट में, ज़्यादातर मेट्रिक की वैल्यू को वैल्यू और बिन साइज़ के हिस्टोग्राम के तौर पर दिखाया जाता है. इसमें, हिस्टोग्राम की वैल्यू, शामिल किए गए सभी सेगमेंट का एक हिस्सा होती है. इन सभी हिस्सों का योग 1 होता है. बिन साइज़, 1.0 और 0.0001 के बीच के फ़्लोटिंग पॉइंट नंबर होते हैं.

डेटा पर क्वेरी करने और उसे विज़ुअलाइज़ करने की प्रोसेस को आसान बनाने के लिए, हिस्टोग्राम बिन की चौड़ाई को सामान्य किया जाता है. इसका मतलब है कि बड़े बिन को छोटे बिन में बांटा जा सकता है. ऐसा इसलिए किया जाता है, ताकि बिन की चौड़ाई को एक जैसा बनाए रखा जा सके. इसके लिए, छोटे बिन में मूल डेंसिटी को बराबर-बराबर शेयर किया जाता है.

लाइसेंस

Google के CrUX डेटासेट, क्रिएटिव कॉमंस एट्रिब्यूशन 4.0 इंटरनैशनल लाइसेंस के तहत लाइसेंस किए जाते हैं.