Metodologi CrUX

Bagian ini mendokumentasikan cara CrUX mengumpulkan dan mengatur data pengalaman pengguna.

Kelayakan

Inti dari set data CrUX adalah pengalaman pengguna individual, yang digabungkan ke dalam distribusi tingkat halaman dan tingkat origin. Bagian ini mendokumentasikan kelayakan pengguna serta persyaratan untuk halaman dan asal yang akan disertakan dalam set data. Semua kriteria kelayakan harus dipenuhi agar pengalaman disertakan dalam data tingkat halaman yang tersedia di PageSpeed Insights dan CrUX API: Pengguna, Asal, dan Halaman. Pengalaman yang memenuhi kriteria Pengguna dan Asal tetapi tidak termasuk Halaman tidak disertakan dalam data tingkat origin yang tersedia di semua sumber data CrUX.

Halaman dan origin secara otomatis disertakan atau dihapus dari set data jika kelayakannya berubah dari waktu ke waktu. Saat ini, Anda tidak dapat mengirimkan halaman atau origin secara manual untuk disertakan.

Dapat ditemukan secara publik

Halaman harus dapat ditemukan secara publik agar dipertimbangkan untuk disertakan dalam set data CrUX.

Halaman ditentukan dapat ditemukan secara publik menggunakan kriteria indeks yang sama seperti mesin telusur.

Halaman tidak dapat memenuhi persyaratan visibilitas jika salah satu kondisi berikut terpenuhi, termasuk halaman root untuk set data asal:

  • Halaman ditayangkan dengan kode status HTTP selain 200 (setelah pengalihan).
  • Halaman ditayangkan dengan header HTTP X-Robots-Tag: noindex atau yang setara.
  • Dokumen ini berisi tag meta <meta name="robots" content="noindex"> atau yang setara.

Buka Google Search Console untuk melihat ringkasan status pengindeksan situs Anda.

Cukup populer

Halaman ditentukan cukup populer jika memiliki jumlah minimum pengunjung. Situs asal dianggap cukup populer jika memiliki jumlah minimum pengunjung di semua halamannya. Jumlah persisnya tidak diungkapkan, tetapi telah dipilih untuk memastikan bahwa kami memiliki sampel yang cukup agar yakin dalam distribusi statistik untuk halaman yang disertakan. Jumlah minimum untuk halaman dan origin sama.

Halaman dan origin yang tidak memenuhi nilai minimum popularitas tidak disertakan dalam set data CrUX.

Origin

Origin mewakili seluruh situs, yang dapat ditangani oleh URL seperti https://www.example.com. Agar dapat disertakan dalam set data CrUX, origin harus memenuhi dua persyaratan:

  1. Dapat ditemukan secara publik
  2. Cukup populer

Anda dapat memverifikasi bahwa origin Anda dapat ditemukan dengan menjalankan audit Lighthouse dan melihat hasil kategori SEO. Situs Anda tidak dapat ditemukan jika halaman root Anda gagal dalam audit Halaman diblokir dari pengindeksan atau Kode status HTTP halaman gagal.

Jika origin dianggap dapat ditemukan secara publik, pengalaman pengguna yang memenuhi syarat di semua halaman origin akan digabungkan di tingkat origin, terlepas dari visibilitas halaman masing-masing. Semua pengalaman ini diperhitungkan untuk persyaratan popularitas asal.

Untuk tujuan kueri, perhatikan bahwa semua asal di set data CrUX menggunakan huruf kecil.

Halaman

Persyaratan untuk halaman yang akan disertakan dalam set data CrUX sama dengan asal:

  1. Dapat ditemukan secara publik
  2. Cukup populer

Anda dapat memverifikasi bahwa halaman dapat ditemukan dengan menjalankan audit Lighthouse dan melihat hasil kategori SEO. Halaman Anda tidak dapat ditemukan jika gagal dalam audit Halaman diblokir dari pengindeksan atau Kode status HTTP halaman tidak berhasil.

Halaman biasanya memiliki ID tambahan di URL-nya, termasuk parameter string kueri seperti ?utm_medium=email dan fragmen seperti #main. ID ini dihilangkan dari URL dalam set data CrUX sehingga semua pengalaman pengguna di halaman digabungkan. Hal ini berguna untuk halaman yang tidak akan memenuhi nilai minimum popularitas jika ada banyak variasi URL yang terputus-putus untuk halaman yang sama. Perlu diketahui bahwa dalam kasus yang jarang terjadi, hal ini mungkin secara tidak terduga mengelompokkan pengalaman untuk halaman yang berbeda; misalnya, jika parameter ?productID=101 dan ?productID=102 mewakili halaman yang berbeda.

Halaman di CrUX diukur berdasarkan halaman tingkat atas. Halaman yang disertakan sebagai iframe tidak dilaporkan secara terpisah di CrUX, tetapi berkontribusi pada metrik halaman tingkat atas. Misalnya, jika https://www.example.com/page.html menyematkan https://www.example.com/frame.html dalam iframe, page.html akan ditampilkan di CrUX (tunduk pada kriteria kelayakan lainnya), tetapi frame.html tidak akan. Dan jika frame.html memiliki CLS yang buruk, CLS akan disertakan saat mengukur CLS untuk page.html. CrUX adalah Laporan Pengalaman Pengguna Chrome dan pengguna bahkan mungkin tidak mengetahui bahwa ini adalah iframe. Oleh karena itu, pengalaman diukur di halaman tingkat teratas—sesuai dengan cara pengguna melihatnya.

Arsitektur situs web dapat merumitkan bagaimana datanya diwakili dalam CrUX. Misalnya, aplikasi web satu halaman (SPA) mungkin menggunakan skema transisi rute berbasis JavaScript untuk berpindah antar-halaman, dibandingkan dengan navigasi halaman berbasis anchor konvensional. Transisi ini muncul sebagai kunjungan halaman baru bagi pengguna, tetapi bagi Chrome dan API platform dasar, seluruh pengalaman diatribusikan ke kunjungan halaman awal. Ini adalah batasan API platform web native tempat CrUX dibuat. Lihat Pengaruh arsitektur SPA terhadap Data Web Inti di web.dev untuk mengetahui informasi selengkapnya.

Pengguna

Agar pengguna dapat menggabungkan pengalamannya di set data CrUX, mereka harus memenuhi kriteria berikut:

  1. Aktifkan pelaporan statistik penggunaan.
  2. Menyinkronkan histori browser anak.
  3. Belum menyetel Frasa sandi sinkronisasi.
  4. Gunakan platform yang didukung.

Platform yang saat ini didukung adalah:

  • Chrome versi desktop termasuk sistem operasi Windows, MacOS, ChromeOS, dan Linux.
  • Chrome versi Android, termasuk aplikasi native yang menggunakan Tab Khusus dan WebAPKs.

Ada beberapa pengecualian penting yang tidak menyediakan data ke set data CrUX:

  • Chrome di iOS.
  • Aplikasi Android native menggunakan WebView.
  • Browser Chromium lainnya (misalnya Microsoft Edge).

Chrome tidak memublikasikan data tentang proporsi pengguna yang memenuhi kriteria ini. Anda dapat mempelajari lebih lanjut data yang kami kumpulkan di Laporan Resmi Privasi Chrome.

Accelerated Mobile Pages (AMP)

Halaman yang dibuat dengan AMP disertakan dalam set data CrUX seperti halaman web lainnya. Mulai rilis CrUX Juni 2020, halaman yang ditayangkan melalui Cache AMP dan / atau yang dirender di AMP Viewer juga dicatat dan diatribusikan ke URL halaman penayang.

Kualitas data

Data di CrUX mengalami sedikit pemrosesan untuk memastikan bahwa data tersebut akurat secara statistik, terstruktur dengan baik, dan mudah dikueri.

Pemfilteran

Set data CrUX difilter untuk memastikan data yang disajikan valid secara statistik. Ini dapat mengecualikan seluruh halaman atau origin agar tidak muncul dalam set data.

Selain kriteria kelayakan yang diterapkan ke asal dan halaman, pemfilteran lebih lanjut akan diterapkan untuk segmen dalam data:

Origin atau halaman yang memiliki lebih dari 20% total traffic dikecualikan karena kombinasi dimensi yang tidak memenuhi syarat dikecualikan sepenuhnya dari set data.

Karena set data tingkat global mencakup pengalaman pengguna dari semua negara, kombinasi dimensi yang tidak memenuhi kriteria popularitas di tingkat negara mungkin tetap disertakan di tingkat global, asalkan ada popularitas yang memadai.

Fuzzing

Sedikit pengacakan diterapkan pada set data untuk mencegah rekayasa balik data sensitif, seperti total volume traffic. Hal ini tidak memengaruhi akurasi statistik gabungan.

Presisi

Sebagian besar nilai metrik dalam set data CrUX direpresentasikan sebagai histogram nilai dan ukuran bin, dengan nilai histogram adalah fraksi dari semua segmen yang disertakan yang menjumlahkan 1. Ukuran biner adalah bilangan floating point antara 1,0 dan 0,0001.

Lebar bin histogram dinormalisasi untuk menyederhanakan kueri dan memvisualisasikan data. Hal ini berarti bahwa kelompok yang lebih besar dapat dibagi menjadi kelompok yang lebih kecil, yang sama-sama memiliki kepadatan asli untuk mempertahankan lebar kelompok yang konsisten.

Lisensi

Set data CrUX oleh Google dilisensikan berdasarkan Lisensi International Creative Commons Attribution 4.0.