CrUX على BigQuery

تعرَّف على كيفية تنظيم بيانات CrUX على BigQuery.

مقدمة

تتوفّر البيانات الأوّلية التي يستند إليها تقرير تجربة المستخدِم في Chrome (CrUX) على BigQuery، وهي قاعدة بيانات مستضافة على Google Cloud.

تتيح أداة CrUX على BigQuery للمستخدمين إجراء طلبات بحث مباشرةً في مجموعة البيانات الكاملة التي تعود إلى عام 2017، على سبيل المثال لتحليل المؤشرات ومقارنة تكنولوجيات الويب ومجالات الأداء المعياري.

يتم تنظيم البيانات حسب الإصدار الشهري، بالإضافة إلى عدد من جداول الملخص لتوفير وصول بسيط للاستعلام عن البيانات.

تشكّل بيانات BigQuery أساس لوحة بيانات CrUX، التي تتيح لك عرض هذه البيانات بشكل مرئي بدون كتابة طلبات بحث SQL.

الوصول إلى مجموعة البيانات

يتطلب استخدام BigQuery حسابًا على Google Cloud ومعرفة أساسية بلغة الاستعلامات البنيوية (SQL). يمكنك الوصول إلى مجموعة بيانات CrUX على BigQuery واستكشافها مجانًا ضمن حدود الإصدار المجاني الذي يتم تجديده شهريًا ويوفّره BigQuery. بالإضافة إلى ذلك، قد يكون مستخدمو Google Cloud الجدد مؤهّلين للحصول على رصيد اشتراك لتغطية النفقات التي تتجاوز المستوى المجاني. يُرجى ملاحظة أنّه يجب تقديم بطاقة ائتمان لمشروع Google Cloud. راجِع المقالة لماذا يجب تقديم بطاقة ائتمان؟.

إذا كانت هذه أول مرة تستخدم فيها BigQuery، اتّبِع الخطوات التالية لإعداد مشروع:

  1. انتقِل إلى إنشاء مشروع في وحدة تحكُّم Google Cloud.
  2. ضع اسمًا لمشروعك الجديد مثل "تقرير تجربة المستخدم في Chrome" ثم انقر على "إنشاء".
  3. أدخِل معلومات الفوترة إذا طُلب منك ذلك.
  4. انتقِل إلى مجموعة بيانات CrUX على BigQuery.

أنت الآن جاهز لبدء الاستعلام عن مجموعة البيانات.

تنظيم المشاريع

يتم إصدار بيانات CrUX على BigQuery في يوم الثلاثاء الثاني من الشهر التالي. ويتم إصداره كل شهر كجدول جديد ضمن chrome-ux-report.all. هناك أيضًا عدد من الجداول المحسّنة التي تقدّم إحصاءات تلخيصية لكل شهر.

مخطّط جدول تفصيلي

يتم عرض الجداول الأوّلية لكل بلد ومجموعة بيانات all حسب السنة والشهر.

الجداول الأوّلية

تحتوي الجداول الأولية على المخطط التالي:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

مخطّط الجدول المحسَّن

يتم توفير جداول محددة لتسهيل الوصول إلى البيانات الموجزة حسب عدد من السمات الرئيسية. لا يتم توفير مدرجات تكرارية، وبدلاً من ذلك يتم تجميع بيانات الأداء في كسور حسب تقييم الأداء والقيمة المئوية الخامسة والسبعين. في هذا المثال، تظهر مجموعة من أمثلة الصفوف من جدول metrics_summary:

yyyymm الأصل fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

يوضّح ذلك أنّه في مجموعة البيانات لعام 202204، استوفت% 90.56 من تجارب المستخدمين الفعليين على https://example.com معايير سرعة عرض أكبر محتوى مرئي (LCP)، وأن القيمة التقريبية لـ LCP ضمن الشريحة المئوية الخامسة والسبعين كانت 1,600 ملي ثانية. وهذا معدل أبطأ قليلاً من الأشهر السابقة.

يتم توفير أربعة جداول مثبّتة:

metrics_summary
المقاييس الرئيسية حسب الشهر والأصل
device_summary
المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز
country_summary
المقاييس الرئيسية حسب الشهر ومكان المصدر ونوع الجهاز والبلد
origin_summary
قائمة بجميع الأصول المضمّنة في مجموعة البيانات

metrics_summary

يتضمّن جدول metrics_summary إحصاءات ملخّصة لكل مصدر وكل مجموعة بيانات شهرية:

yyyymm
شهر فترة جمع البيانات
origin
عنوان URL لمصدر الموقع الإلكتروني
rank
ترتيب حسب مدى الانتشار التقريبي (اعتبارًا من آذار (مارس) 2021)
[small|medium|large]_cls
جزء من عدد الزيارات حسب حدود متغيّرات التصميم التراكمية (CLS)
[fast|avg|slow]_<metric>
نسبة الزيارات حسب حدود الأداء
p75_<metric>
قيمة الشريحة المئوية الخامسة والسبعون لمقاييس الأداء (بالملي ثانية)
notification_permission_[accept|deny|ignore|dismiss]
نسبة سلوكيات أذونات إرسال الإشعارات
[desktop|phone|tablet]Density
جزء من عدد الزيارات حسب شكل الجهاز
[_4G|_3G|_2G|slow2G|offline]Density
نسبة الزيارات حسب نوع الاتصال الفعّال
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
جزء من أنواع التنقّل

device_summary

يحتوي جدول device_summary على إحصاءات مجمّعة حسب الشهر ومكان المصدر والبلد والجهاز. بالإضافة إلى metrics_summary عمودًا، هناك:

device
شكل الجهاز

country_summary

يحتوي جدول country_summary على إحصاءات مجمّعة حسب الشهر ومكان المصدر والبلد والجهاز. بالإضافة إلى الأعمدة metrics_summary، يتوفّر ما يلي:

country_code
رمز البلد المكوّن من حرفَين
device
شكل الجهاز

origin_summary

يتضمّن جدول origin_summary قائمة بجميع الأصول في مجموعة بيانات CrUX، ويتم تعديله شهريًا باستخدام أحدث قائمة للمصادر في مجموعة البيانات ويحتوي على عمود واحد: origin.

مجموعة البيانات التجريبية

الجداول في مجموعة البيانات التجريبية هي نُسخ طبق الأصل من جداول YYYYMM التلقائية، ولكنها تستخدِم ميزات BigQuery الأحدث والأكثر تقدّمًا، مثل التقسيم والتجميع، ما يتيح لك كتابة طلبات بحث أسرع وأسهل وأرخص.

country

تحتوي مجموعة البيانات experimental.country على بيانات مجمّعة من مجموعات البيانات country_CC مع عمود yyyymm إضافي لتاريخ مجموعة البيانات. يتطابق المخطّط مع الجداول الأوّلية مع إضافة عمودَي التاريخ وcountry_code، ما يتيح تنفيذ طلبات البحث للمقارنة على مستوى البلد بمرور الوقت بدون دمج الجداول الشهرية.

global

تحتوي مجموعة بيانات experimental.global على بيانات مجمّعة من مجموعة بيانات all مع عمود yyyymm إضافي لتاريخ مجموعة البيانات. يتطابق المخطّط مع الجداول الأوّلية مع إضافة التاريخ، ما يسمح بتنفيذ طلبات البحث للمقارنة على مدار الوقت بدون دمج الجداول الشهرية.