تعرَّف على كيفية تنظيم بيانات CrUX على BigQuery.
مقدمة
تتوفّر البيانات الأوّلية التي يستند إليها تقرير تجربة المستخدِم في Chrome (CrUX) على BigQuery، وهي قاعدة بيانات مستضافة على Google Cloud.
تتيح أداة CrUX على BigQuery للمستخدمين إجراء طلبات بحث مباشرةً في مجموعة البيانات الكاملة التي تعود إلى عام 2017، على سبيل المثال لتحليل المؤشرات ومقارنة تكنولوجيات الويب ومجالات الأداء المعياري.
يتم تنظيم البيانات حسب الإصدار الشهري، بالإضافة إلى عدد من الجداول التلخيصية لتوفير إمكانية وصول بسيطة للاستعلام عن البيانات.
تشكّل بيانات BigQuery أساس لوحة بيانات CrUX، التي تتيح لك عرض هذه البيانات بشكل مرئي بدون كتابة طلبات بحث SQL.
الوصول إلى مجموعة البيانات
يتطلب استخدام BigQuery حسابًا على Google Cloud ومعرفة أساسية بلغة الاستعلامات البنيوية (SQL). يمكنك الوصول إلى مجموعة بيانات CrUX على BigQuery واستكشافها مجانًا ضمن حدود الإصدار المجاني الذي يتم تجديده شهريًا ويوفّره BigQuery. بالإضافة إلى ذلك، قد يكون مستخدمو Google Cloud الجدد مؤهّلين للحصول على رصيد اشتراك لتغطية النفقات التي تتجاوز المستوى المجاني. يُرجى العِلم أنّه يجب تقديم بطاقة ائتمان لمشروع Google Cloud، اطّلِع على لماذا أحتاج إلى تقديم بطاقة ائتمان؟.
إذا كانت هذه أول مرة تستخدم فيها BigQuery، اتّبِع الخطوات التالية لإعداد مشروع:
- انتقِل إلى إنشاء مشروع في وحدة تحكّم Google Cloud.
- أدخِل اسمًا لمشروعك الجديد، مثل "تقرير تجربة المستخدم في Chrome"، ثم انقر على "إنشاء".
- أدخِل معلومات الفوترة إذا طُلب منك ذلك.
- انتقِل إلى مجموعة بيانات CrUX على BigQuery.
أنت الآن جاهز لبدء الاستعلام عن مجموعة البيانات.
تنظيم المشروع
يتم إصدار بيانات CrUX على BigQuery في يوم الثلاثاء الثاني من الشهر التالي. ويتم إصداره كل شهر كجدول جديد ضمن chrome-ux-report.all
. هناك أيضًا عدد من الجداول المحسّنة التي تقدّم إحصاءات موجزة لكل شهر.
- `chrome-ux-report
مخطّط جدول تفصيلي
يتم تقديم الجداول الأوّلية لكل بلد ومجموعة بيانات all
حسب السنة والشهر.
الجداول الأوّلية
تحتوي الجداول الأوّلية على المخطّط التالي:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
مخطّط الجدول المحسَّن
يتم توفير الجداول المحفوظة لسهولة الوصول إلى البيانات الملخّصة حسب عدد من السمات الرئيسية. لا يتمّ توفير أيّ رسم بياني شريطي، بل يتمّ تجميع بيانات الأداء في أجزاء حسب تقييم الأداء وقيمة الشريحة المئوية الـ 75. في هذا المثال، تظهر مجموعة من أمثلة الصفوف من جدول metrics_summary
:
yyyymm | الأصل | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
يشير ذلك إلى أنّه في مجموعة البيانات 202204، استوفت نسبة% 90.56 من تجارب المستخدمين الفعليين على https://example.com
معايير سرعة عرض أكبر محتوى مرئي (LCP) الجيدة، وأنّ قيمة LCP للشريحة المئوية الـ 75 كانت 1,600 ملي ثانية. وهذا معدل أبطأ قليلاً من الأشهر السابقة.
يتم توفير أربعة جداول مثبّتة:
metrics_summary
- المقاييس الرئيسية حسب الشهر والمصدر
device_summary
- المقاييس الرئيسية حسب الشهر ومكان المصدر ونوع الجهاز
country_summary
- المقاييس الرئيسية حسب الشهر ومكان المصدر ونوع الجهاز والبلد
origin_summary
- قائمة بجميع المصادر المضمّنة في مجموعة البيانات
metrics_summary
يحتوي جدول metrics_summary
على إحصاءات تلخيصية لكل مصدر وكل مجموعة بيانات شهرية:
yyyymm
- شهر فترة جمع البيانات
origin
- عنوان URL لمصدر الموقع الإلكتروني
rank
- ترتيب حسب مدى الانتشار التقريبي (اعتبارًا من آذار/مارس 2021)
[small|medium|large]_cls
- نسبة الزيارات حسب حدود متغيّر التصميم التراكمية
[fast|avg|slow]_<metric>
- نسبة الزيارات حسب حدود الأداء
p75_<metric>
- قيمة الشريحة المئوية الخامسة والسبعون لمقاييس الأداء (بالملّي ثانية)
notification_permission_[accept|deny|ignore|dismiss]
- نسبة سلوكيات أذونات إرسال الإشعارات
[desktop|phone|tablet]Density
- نسبة الزيارات حسب شكل الجهاز
[_4G|_3G|_2G|slow2G|offline]Density
- نسبة الزيارات حسب نوع الاتصال الفعّال
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- نسبة أنواع التنقّل
device_summary
يحتوي جدول device_summary
على إحصاءات مجمّعة حسب الشهر ومكان المصدر والبلد والجهاز. بالإضافة إلى metrics_summary
عمودًا، هناك:
device
- شكل الجهاز
country_summary
يحتوي جدول country_summary
على إحصاءات مجمّعة حسب الشهر ومكان المصدر والبلد والجهاز. بالإضافة إلى metrics_summary
عمودًا، هناك:
country_code
- رمز البلد المكوّن من حرفَين
device
- شكل الجهاز
origin_summary
يحتوي جدول origin_summary
على قائمة بجميع مصادر الزيارات في مجموعة بيانات CrUX، ويتم تعديله شهريًا بآخر قائمة لمصادر الزيارات في مجموعة البيانات، ويتضمّن عمودًا واحدًا: origin
.
مجموعة البيانات التجريبية
الجداول في مجموعة البيانات التجريبية هي نُسخ طبق الأصل من جداول YYYYMM
التلقائية، ولكنها تستخدِم ميزات BigQuery الأحدث والأكثر تقدّمًا، مثل التقسيم والتجميع، ما يتيح لك كتابة طلبات بحث أسرع وأسهل وأرخص.
country
تحتوي مجموعة البيانات experimental.country
على بيانات مجمّعة من مجموعات البيانات country_CC
مع عمود yyyymm
إضافي لتاريخ مجموعة البيانات. يتطابق المخطّط مع الجداول الأوّلية مع إضافة عمودَي التاريخ وcountry_code
، ما يتيح تنفيذ طلبات البحث للمقارنة على مستوى البلد بمرور الوقت بدون دمج الجداول الشهرية.
global
تحتوي مجموعة البيانات experimental.global
على بيانات مجمّعة من مجموعة البيانات all
مع عمود yyyymm
إضافي لتاريخ مجموعة البيانات. يتطابق المخطّط مع الجداول الأوّلية مع إضافة التاريخ، ما يسمح بتنفيذ طلبات بحث المقارنة على مدار الوقت بدون دمج الجداول الشهرية.