CrUX در BigQuery

با نحوه ساختار داده های CrUX در BigQuery آشنا شوید.

مقدمه

داده‌های خام پشت گزارش Chrome UX (CrUX) در BigQuery موجود است، پایگاه داده‌ای که در Google Cloud میزبانی می‌شود.

CrUX در BigQuery به کاربران این امکان را می دهد که مستقیماً مجموعه داده کامل را از سال 2017 پرس و جو کنند، به عنوان مثال برای تجزیه و تحلیل روندها، مقایسه فناوری های وب و دامنه های معیار.

ساختار داده ها بر اساس انتشار ماهانه و همچنین تعدادی جداول خلاصه برای ارائه دسترسی ساده برای پرس و جو از داده ها است.

داده های BigQuery اساس داشبورد CrUX است که به شما امکان می دهد این داده ها را بدون نوشتن پرس و جوهای SQL تجسم کنید.

دسترسی به مجموعه داده

استفاده از BigQuery به یک حساب Google Cloud و دانش اولیه SQL نیاز دارد. مجموعه داده CrUX در BigQuery برای دسترسی و کاوش تا سقف ردیف رایگان رایگان است که هر ماه تمدید می شود و توسط BigQuery ارائه می شود. علاوه بر این، کاربران جدید Google Cloud ممکن است واجد شرایط دریافت اعتبار ثبت‌نام برای پوشش هزینه‌های فراتر از سطح رایگان باشند. توجه داشته باشید که برای پروژه Google Cloud باید کارت اعتباری ارائه شود، ببینید چرا باید کارت اعتباری ارائه کنم؟ .

اگر اولین باری است که از BigQuery استفاده می‌کنید، مراحل زیر را برای راه‌اندازی یک پروژه دنبال کنید:

  1. به سمت ایجاد پروژه در کنسول Google Cloud بروید.
  2. به پروژه جدید خود نامی مانند «گزارش کاربری Chrome من» بدهید و روی ایجاد کلیک کنید.
  3. در صورت درخواست، اطلاعات صورتحساب خود را ارائه دهید.
  4. به مجموعه داده CrUX در BigQuery بروید

اکنون آماده شروع پرس و جو از مجموعه داده هستید.

سازمان پروژه

داده های CrUX در BigQuery در دومین سه شنبه ماه بعد منتشر می شود. هر ماه به عنوان یک جدول جدید تحت chrome-ux-report.all منتشر می شود. همچنین تعدادی جداول تحقق یافته وجود دارد که آمار خلاصه ای را برای هر ماه ارائه می دهد.

طرح جدول تفصیلی

جداول خام برای هر کشور و all مجموعه داده ها بر اساس سال و ماه ارائه شده است.

جداول خام

جداول خام دارای طرح زیر هستند:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

طرح جدول مادی شده

جداول مادی شده برای دسترسی آسان تر به داده های خلاصه با تعدادی از ابعاد کلیدی ارائه شده است. هیچ هیستوگرام ارائه نشده است، در عوض داده های عملکرد با ارزیابی عملکرد و مقدار صدک 75 به کسری جمع می شوند. مجموعه ای از ردیف های نمونه از جدول metrics_summary در این مثال نشان داده شده است:

yyyymm منشاء fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

این نشان می‌دهد که در مجموعه داده 202204، 90.56٪ از تجربیات کاربر واقعی در https://example.com معیارهای LCP خوب را برآورده می‌کنند و مقدار درشت صدک 75 LCP 1600 میلی‌ثانیه است. این مقدار کمی کندتر از ماه های گذشته است.

چهار جدول مادی ارائه شده است:

metrics_summary
معیارهای کلیدی بر اساس ماه و مبدا
device_summary
معیارهای کلیدی بر اساس ماه، مبدا و نوع دستگاه
country_summary
معیارهای کلیدی بر اساس ماه، مبدا، نوع دستگاه و کشور
origin_summary
لیستی از همه مبداهای موجود در مجموعه داده

metrics_summary

جدول metrics_summary شامل آمار خلاصه برای هر مبدا و هر مجموعه داده ماهانه است:

yyyymm
ماه دوره جمع آوری داده ها
origin
URL مبدا سایت
rank
رتبه بندی محبوبیت درشت (از مارس 2021 )
[small|medium|large]_cls
کسری از ترافیک توسط آستانه های CLS
[fast|avg|slow]_<metric>
کسری از ترافیک بر اساس آستانه عملکرد
p75_<metric>
ارزش صدک 75 معیارهای عملکرد (میلی ثانیه)
notification_permission_[accept|deny|ignore|dismiss]
کسری از رفتارهای مجوز اعلان
[desktop|phone|tablet]Density
کسری از ترافیک بر اساس فاکتور شکل
[_4G|_3G|_2G|slow2G|offline]Density
کسری از ترافیک بر اساس نوع اتصال موثر
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
کسری از انواع ناوبری

device_summary

جدول device_summary شامل آمار انبوه بر اساس ماه، مبدا، کشور و دستگاه است. علاوه بر ستون های metrics_summary وجود دارد:

device
فاکتور فرم دستگاه

country_summary

جدول country_summary شامل آمار انبوه بر اساس ماه، مبدا، کشور و دستگاه است. علاوه بر ستون های metrics_summary وجود دارد:

country_code
کد کشور دو حرفی
device
فاکتور فرم دستگاه

origin_summary

جدول origin_summary شامل لیستی از تمام مبداها در مجموعه داده CrUX است. ماهانه با آخرین لیست مبدا در مجموعه داده به روز می شود و دارای یک ستون است: origin .

مجموعه داده تجربی

جداول موجود در مجموعه داده آزمایشی کپی دقیق جداول پیش‌فرض YYYYMM هستند، اما از ویژگی‌های جدیدتر و پیشرفته‌تر BigQuery مانند پارتیشن‌بندی و خوشه‌بندی استفاده می‌کنند که به شما امکان می‌دهد جستارهای سریع‌تر، ساده‌تر و ارزان‌تر بنویسید.

country

مجموعه داده experimental.country حاوی داده‌های انبوهی از مجموعه داده‌های country_CC با یک ستون yyyymm اضافی برای تاریخ مجموعه است. این طرح با جداول خام با اضافه کردن ستون‌های تاریخ و country_code یکسان است و امکان مقایسه در سطح کشور در طول زمان را بدون پیوستن به جداول ماهانه می‌دهد.

global

مجموعه داده experimental.global حاوی داده‌های انباشته‌شده از all مجموعه داده با یک ستون yyyymm اضافی برای تاریخ مجموعه است. این طرح با جداول خام با اضافه کردن تاریخ یکسان است و امکان مقایسه در طول زمان را بدون پیوستن به جداول ماهانه فراهم می کند.