CrUX के काम करने का तरीका

इस सेक्शन में बताया गया है कि CrUX, उपयोगकर्ता अनुभव से जुड़ा डेटा कैसे इकट्ठा और व्यवस्थित करता है.

ज़रूरी शर्तें

CrUX डेटासेट के लिए, अलग-अलग उपयोगकर्ता अनुभव को खास तौर पर दिखाया जाता है, जिन्हें पेज-लेवल और ऑरिजिन-लेवल डिस्ट्रिब्यूशन में एग्रीगेट किया जाता है. इस सेक्शन में, उपयोगकर्ता से जुड़ी ज़रूरी शर्तों के बारे में बताया गया है. साथ ही, डेटासेट में पेजों और ऑरिजिन को शामिल करने से जुड़ी ज़रूरी शर्तों के बारे में भी बताया गया है. PageSpeed Insights और CrUX API में उपलब्ध पेज-लेवल के डेटा में अनुभव को शामिल करने के लिए, सभी ज़रूरी शर्तें पूरी होनी चाहिए: उपयोगकर्ता, ऑरिजिन, और पेज. ऐसे अनुभव जो उपयोगकर्ता और ऑरिजिन से जुड़ी शर्तों को पूरा करते हैं, लेकिन पेज को नहीं, उन्हें सभी CrUX डेटा सोर्स में उपलब्ध ऑरिजिन-लेवल के डेटा में शामिल नहीं किया जाता.

अगर पेजों और ऑरिजिन की ज़रूरी शर्तों में समय के साथ बदलाव होता है, तो उन्हें डेटासेट में अपने-आप शामिल कर लिया जाता है या हटा दिया जाता है. फ़िलहाल, पेजों या ऑरिजिन को शामिल करने के लिए, मैन्युअल तरीके से सबमिट नहीं किया जा सकता.

सार्वजनिक रूप से खोजे जाने लायक

CrUX डेटासेट में शामिल किए जाने के लिए, पेज का सार्वजनिक तौर पर पता होना ज़रूरी है.

किसी पेज को सार्वजनिक तौर पर खोजे जाने लायक बनाने के लिए, सर्च इंजन की इंडेक्स करने की सुविधा की शर्तों का पालन किया जाता है.

अगर नीचे दी गई कोई भी शर्त पूरी होती है, तो पेज खोजे जाने की ज़रूरी शर्त को पूरा नहीं कर सकता. इसमें ऑरिजिन डेटासेट के रूट पेज भी शामिल हैं:

  • इस पेज को 200 के बजाय, एचटीटीपी स्टेटस कोड के साथ दिखाया जाता है (रीडायरेक्ट होने के बाद).
  • पेज को एचटीटीपी X-Robots-Tag: noindex हेडर या ऐसे ही किसी यूआरएल के साथ दिखाया जाता है.
  • दस्तावेज़ में <meta name="robots" content="noindex"> मेटा टैग या इसके बराबर का टैग शामिल होता है.

अपनी साइट के इंडेक्स होने की स्थिति के बारे में खास जानकारी पाने के लिए, Google Search Console पर जाएं.

काफ़ी लोकप्रिय

अगर किसी पेज पर विज़िटर की संख्या कम से कम है, तो उसे काफ़ी लोकप्रिय माना जाता है. अगर किसी ऑरिजिन के सभी पेजों पर आने वाले लोगों की संख्या कम से कम होती है, तो उसे 'ज़रूरत के मुताबिक लोकप्रिय' माना जाता है. सटीक संख्या ज़ाहिर नहीं की जाती, लेकिन इसे यह पक्का करने के लिए चुना जाता है कि शामिल किए गए पेजों के आंकड़ों के डिस्ट्रिब्यूशन को लेकर भरोसा रखने के लिए, हमारे पास काफ़ी सैंपल हैं. पेजों और ऑरिजिन के लिए कम से कम संख्या एक जैसी होती है.

ऐसे पेज और ऑरिजिन, जो लोकप्रियता के थ्रेशोल्ड को पूरा नहीं करते उन्हें CrUX डेटासेट में शामिल नहीं किया जाता.

शुरुआत की जगह

ऑरिजिन ऐसी पूरी वेबसाइट के बारे में बताता है जिसे https://www.example.com जैसे यूआरएल से पता किया जा सकता है. CrUX डेटासेट में किसी ऑरिजिन को शामिल करने के लिए, उसे दो ज़रूरी शर्तों को पूरा करना होगा:

  1. सार्वजनिक तौर पर खोजे जाने लायक
  2. काफ़ी हद तक लोकप्रिय

Lighthouse ऑडिट चलाकर और एसईओ कैटगरी के नतीजों को देखकर, यह पुष्टि की जा सकती है कि आपके ऑरिजिन को खोजा जा सकता है. अगर आपका रूट पेज, पेज को इंडेक्स होने से ब्लॉक किया गया या पेज के एचटीटीपी स्टेटस कोड में काम नहीं करता है, तो उसे आपकी साइट को नहीं खोजा जा सकता.

अगर किसी ऑरिजिन को सार्वजनिक तौर पर खोजा जा सकता है, तो उस ऑरिजिन के सभी पेजों पर मौजूद, ज़रूरी शर्तें पूरी करने वाले उपयोगकर्ता अनुभव को ऑरिजिन लेवल पर एग्रीगेट किया जाता है. भले ही, अलग-अलग पेज को खोजे जाने लायक बनाएं. ये सभी अनुभव, ऑरिजिन की लोकप्रियता से जुड़ी ज़रूरी शर्त के हिसाब से होते हैं.

क्वेरी करने के लिए, ध्यान रखें कि CrUX डेटासेट में सभी ऑरिजिन लोअरकेस में हैं.

Page

CrUX डेटासेट में किसी पेज को शामिल करने के लिए, ज़रूरी शर्तें वही हैं जो ऑरिजिन से जुड़ी हों:

  1. सार्वजनिक तौर पर खोजे जाने लायक
  2. काफ़ी हद तक लोकप्रिय

लाइटहाउस ऑडिट चलाकर और एसईओ कैटगरी के नतीजों को देखकर, इस बात की पुष्टि की जा सकती है कि पेज को खोजा जा सकता है. अगर पेज को इंडेक्स करने से ब्लॉक किया गया है या पेज को इंडेक्स नहीं किया जा सकता है, तो वह उसे ढूंढा नहीं जा सकता.

आम तौर पर, पेजों के यूआरएल में अतिरिक्त आइडेंटिफ़ायर होते हैं. इनमें ?utm_medium=email जैसे क्वेरी स्ट्रिंग पैरामीटर और #main जैसे फ़्रैगमेंट शामिल होते हैं. इन आइडेंटिफ़ायर को CrUX डेटासेट के यूआरएल से हटा दिया जाता है, ताकि पेज पर सभी उपयोगकर्ता अनुभव एक साथ इकट्ठा किए जा सकें. यह उन पेजों के लिए फ़ायदेमंद है जो एक ही पेज के लिए, अलग-अलग यूआरएल वैरिएशन होने पर लोकप्रियता की सीमा को पूरा नहीं करते. ध्यान दें कि कुछ मामलों में यह अलग-अलग पेजों के अनुभवों को अनचाहे तरीके से एक साथ ग्रुप कर सकता है. उदाहरण के लिए, अगर ?productID=101 और ?productID=102 पैरामीटर अलग-अलग पेजों को दिखाते हैं.

CrUX के पेजों को, टॉप-लेवल के पेज के आधार पर मेज़र किया जाता है. CrUX में अलग से, iframe के तौर पर शामिल किए गए पेजों की रिपोर्ट नहीं की जाती. हालांकि, ये टॉप लेवल पेज की मेट्रिक में योगदान करते हैं. उदाहरण के लिए, अगर https://www.example.com/page.html, https://www.example.com/frame.html को किसी iframe में एम्बेड करता है, तो CrUX में page.html दिखेगा (अन्य ज़रूरी शर्तों पर निर्भर करता है) लेकिन frame.html नहीं. अगर frame.html का सीएलएस खराब है, तो page.html के लिए सीएलएस को मेज़र करते समय, सीएलएस को शामिल किया जाएगा. CrUX, Chrome उपयोगकर्ता अनुभव रिपोर्ट है और उपयोगकर्ता को शायद यह पता भी न हो कि यह एक iframe है. इसलिए, टॉप लेवल पेज पर अनुभव का आकलन इस आधार पर किया जाता है कि उपयोगकर्ता इसे कैसे देखते हैं.

किसी वेबसाइट के आर्किटेक्चर की वजह से, CrUX में उसका डेटा दिखाने में समस्या आ सकती है. उदाहरण के लिए, एक पेज के ऐप्लिकेशन (एसपीए) एक पेज से दूसरे पेज पर जाने के लिए, JavaScript पर आधारित रूट ट्रांज़िशन स्कीम का इस्तेमाल कर सकते हैं. इसके लिए, वे ऐंकर पेज पर नेविगेट करने के पारंपरिक तरीके नहीं अपनाते. लोगों को ये ट्रांज़िशन, नए पेज व्यू के तौर पर दिखते हैं. हालांकि, Chrome और इस्तेमाल के लिए मौजूद प्लैटफ़ॉर्म एपीआई के लिए, पूरे अनुभव को शुरुआती पेज व्यू के हिसाब से एट्रिब्यूट किया जाता है. यह उन नेटिव वेब प्लैटफ़ॉर्म एपीआई की सीमा है जिन पर CrUX बनाया गया है. ज़्यादा जानकारी के लिए, web.dev पर एसपीए आर्किटेक्चर से वेबसाइट की परफ़ॉर्मेंस की जानकारी पर असर पड़ता है देखें.

उपयोगकर्ता

किसी उपयोगकर्ता के अनुभव को CrUX डेटासेट में इकट्ठा करने के लिए, उसे नीचे दी गई शर्तों को पूरा करना होगा:

  1. इस्तेमाल के आंकड़े की रिपोर्टिंग चालू करें.
  2. उसका ब्राउज़र इतिहास सिंक करें.
  3. सिंक चालू या बंद करने के लिए लंबा पासवर्ड सेट नहीं होना चाहिए.
  4. साथ काम करने वाले प्लैटफ़ॉर्म का इस्तेमाल करें.

फ़िलहाल, इन प्लैटफ़ॉर्म पर काम किया जा सकता है:

  • Chrome के डेस्कटॉप वर्शन, जिनमें Windows, MacOS, ChromeOS, और Linux ऑपरेटिंग सिस्टम शामिल हैं.
  • Chrome के Android वर्शन, जिनमें कस्टम टैब और WebAPKs का इस्तेमाल करने वाले खास ऐप्लिकेशन शामिल हैं.

कुछ अहम अपवाद हैं जो CrUX डेटासेट को डेटा नहीं देते:

  • iOS पर Chrome.
  • वेबव्यू का इस्तेमाल करने वाले स्थानीय Android ऐप्लिकेशन.
  • अन्य Chromium ब्राउज़र, जैसे कि Microsoft Edge.

Chrome इन शर्तों को पूरा करने वाले उपयोगकर्ताओं की संख्या के बारे में डेटा पब्लिश नहीं करता. हम Chrome की निजता से जुड़े व्हाइट पेपर में जो डेटा इकट्ठा करते हैं उसके बारे में ज़्यादा जानें.

Accelerated Mobile Pages (AMP)

किसी दूसरे वेब पेज की तरह, एएमपी की मदद से बनाए गए पेज CrUX डेटासेट में शामिल होते हैं. जून 2020 CrUX रिलीज़ तक, एएमपी कैश और / या एएमपी व्यूअर में रेंडर किए गए पेजों को भी कैप्चर किया जाता है और पब्लिशर के पेज के यूआरएल में शामिल किया जाता है.

डेटा गुणवत्ता

CrUX में डेटा को कुछ हद तक प्रोसेस किया जाता है. ऐसा इसलिए किया जाता है, ताकि यह पक्का किया जा सके कि यह आंकड़ों के हिसाब से सटीक, अच्छी तरह से स्ट्रक्चर किया गया, और क्वेरी करने में आसान है.

फ़िल्टर करना

CrUX डेटासेट को फ़िल्टर करके यह पक्का किया जाता है कि पेश किया गया डेटा आंकड़ों के हिसाब से मान्य है. इसकी वजह से हो सकता है कि सभी पेज या ऑरिजिन, डेटासेट में न दिखें.

ऑरिजिन और पेजों पर लागू होने वाली ज़रूरी शर्तों के अलावा, डेटा में मौजूद सेगमेंट के लिए फ़िल्टर भी लागू होते हैं:

ऐसे ऑरिजिन या पेजों को डेटासेट से पूरी तरह बाहर कर दिया जाता है जिन्हें डाइमेंशन के गलत कॉम्बिनेशन की वजह से कुल ट्रैफ़िक का 20% से ज़्यादा हिस्सा बाहर कर दिया गया है.

ग्लोबल लेवल के डेटासेट में सभी देशों के उपयोगकर्ता अनुभव शामिल होते हैं. इसलिए, देश के लेवल पर लोकप्रियता की ज़रूरी शर्तों को पूरा न करने वाले डाइमेंशन के कॉम्बिनेशन को अब भी ग्लोबल लेवल पर शामिल किया जा सकता है, बशर्ते कि काफ़ी लोकप्रियता उपलब्ध हो.

फ़ज़िंग

कुल ट्रैफ़िक जैसे संवेदनशील डेटा की रिवर्स इंजीनियरिंग को रोकने के लिए, डेटासेट पर कुछ गड़बड़ी लागू की जाती है. इससे कुल आंकड़ों के सटीक होने पर कोई असर नहीं पड़ता.

स्पष्टता

CrUX डेटासेट में ज़्यादातर मेट्रिक वैल्यू, वैल्यू और बिन साइज़ के हिस्टोग्राम के रूप में दिखाई जाती हैं, जहां हिस्टोग्राम की वैल्यू, शामिल किए गए सभी सेगमेंट का वह हिस्सा होती है जिसका योग 1 होता है. बिन साइज़, 1.0 और 0.0001 के बीच के फ़्लोटिंग पॉइंट नंबर होते हैं.

हिस्टोग्राम बिन की चौड़ाई सामान्य होती है, ताकि डेटा को आसानी से खोजा और देखा जा सके. इसका मतलब है कि बड़े बिन को छोटे बिन में बांटा जा सकता है, जो बिन की चौड़ाई को एक जैसा बनाए रखने के लिए, ओरिजनल डेंसिटी को बराबर रखते हैं.

लाइसेंस

Google के CrUX डेटासेट का लाइसेंस, क्रिएटिव कॉमंस एट्रिब्यूशन 4.0 इंटरनैशनल लाइसेंस के तहत मिलता है.