Phương pháp CrUX

Phần này ghi lại cách CrUX thu thập và sắp xếp dữ liệu trải nghiệm người dùng.

Điều kiện sử dụng

Trọng tâm của tập dữ liệu CrUX là trải nghiệm người dùng cá nhân, được tổng hợp thành các bản phân phối cấp trang và cấp gốc. Phần này ghi lại tính đủ điều kiện của người dùng và các yêu cầu đối với việc đưa trang cũng như nguồn gốc vào tập dữ liệu. Bạn phải đáp ứng tất cả điều kiện để một trải nghiệm được đưa vào dữ liệu cấp trang có trong PageSpeed Insights và CrUX API: Người dùng, Nguồn gốcTrang. Những trải nghiệm đáp ứng tiêu chí Người dùng và Nguồn gốc nhưng không đáp ứng Trang sẽ không được đưa vào dữ liệu cấp nguồn gốc có trong mọi nguồn dữ liệu CrUX.

Các trang và nguồn gốc sẽ tự động được đưa vào hoặc bị xoá khỏi tập dữ liệu nếu điều kiện của chúng thay đổi theo thời gian. Hiện tại, bạn không thể gửi trang hoặc nguồn gốc để đưa vào theo cách thủ công.

Có thể tìm thấy công khai

Trang phải tìm thấy công khai để được xem xét đưa vào tập dữ liệu CrUX.

Khi sử dụng cùng một tiêu chí khả năng lập chỉ mục như các công cụ tìm kiếm, trang đó được xác định là có thể tìm được công khai.

Một trang không thể đáp ứng yêu cầu về khả năng phát hiện nếu bất kỳ điều kiện nào sau đây được đáp ứng, bao gồm cả trang gốc của tập dữ liệu gốc:

  • Trang này được phân phát bằng một mã trạng thái HTTP không phải là 200 (sau khi chuyển hướng).
  • Trang này được phân phát với một tiêu đề HTTP X-Robots-Tag: noindex hoặc tương đương.
  • Tài liệu này có một thẻ meta <meta name="robots" content="noindex"> hoặc một thẻ tương đương.

Hãy tham khảo Google Search Console để biết thông tin tổng quan về trạng thái lập chỉ mục của trang web.

Khá phổ biến

Một trang được xác định là đủ phổ biến nếu có số lượng khách truy cập tối thiểu. Nguồn gốc được xác định là đủ phổ biến nếu nguồn gốc đó có số lượng khách truy cập tối thiểu trên tất cả các trang. Con số chính xác không được tiết lộ, nhưng đã được chọn để đảm bảo rằng chúng tôi có đủ số mẫu để tin tưởng vào sự phân phối thống kê của các trang được đưa vào. Số lượng tối thiểu là giống nhau cho các trang và nguồn gốc.

Những trang và nguồn gốc không đáp ứng ngưỡng mức độ phổ biến sẽ không được đưa vào tập dữ liệu CrUX.

Điểm gốc

Nguồn gốc đại diện cho toàn bộ trang web, có thể xác định bằng một URL như https://www.example.com. Để một nguồn gốc được đưa vào tập dữ liệu CrUX, nguồn gốc đó phải đáp ứng 2 yêu cầu:

  1. Có thể tìm thấy công khai
  2. Khá phổ biến

Bạn có thể xác minh rằng nguồn gốc của mình có thể phát hiện được bằng cách chạy quy trình kiểm tra Lighthouse và xem kết quả danh mục SEO. Google sẽ không tìm thấy trang web của bạn nếu trang gốc của bạn không vượt qua được bài kiểm tra Trang bị chặn lập chỉ mục hoặc Trang có mã trạng thái HTTP không thành công.

Nếu một nguồn gốc được xác định là có thể tìm thấy công khai, thì trải nghiệm người dùng đủ điều kiện trên tất cả các trang của nguồn gốc đó sẽ được tổng hợp ở cấp độ gốc, bất kể khả năng phát hiện của từng trang là gì. Tất cả những trải nghiệm này đều được tính vào yêu cầu về mức độ phổ biến của nguồn gốc.

Đối với mục đích truy vấn, xin lưu ý rằng tất cả nguồn gốc trong tập dữ liệu CrUX đều là chữ thường.

Trang

Các yêu cầu để một trang được đưa vào tập dữ liệu CrUX giống với các nguồn gốc:

  1. Có thể tìm thấy công khai
  2. Khá phổ biến

Bạn có thể xác minh rằng một trang có thể phát hiện được bằng cách chạy công cụ kiểm tra Lighthouse và xem kết quả danh mục SEO. Google sẽ không tìm thấy trang của bạn nếu trang không vượt qua được quy trình kiểm tra Trang bị chặn lập chỉ mục hoặc Trang có mã trạng thái HTTP không thành công.

Các trang thường có giá trị nhận dạng bổ sung trong URL, bao gồm các tham số chuỗi truy vấn như ?utm_medium=email và các mảnh như #main. Các giá trị nhận dạng này sẽ bị xoá khỏi URL trong tập dữ liệu CrUX để tổng hợp tất cả trải nghiệm người dùng trên trang. Điều này hữu ích cho những trang không đáp ứng được ngưỡng về mức độ phổ biến nếu có nhiều biến thể URL rời rạc cho cùng một trang. Xin lưu ý rằng trong một số ít trường hợp, thao tác này có thể đột ngột nhóm các trải nghiệm cho các trang riêng biệt lại với nhau; ví dụ: nếu các thông số ?productID=101?productID=102 đại diện cho các trang khác nhau.

Các trang trong CrUX được đo lường dựa trên trang cấp cao nhất. Các trang được đưa vào dưới dạng iframe không được báo cáo riêng trong CrUX nhưng có đóng góp vào chỉ số của trang cấp cao nhất. Ví dụ: nếu https://www.example.com/page.html nhúng https://www.example.com/frame.html vào một iframe, thì page.html sẽ được biểu thị bằng CrUX (tuân theo các tiêu chí khác) nhưng frame.html sẽ không. Ngoài ra, nếu frame.htmlCLS kém, thì CLS sẽ được đưa vào khi đo lường CLS cho page.html. CrUX là Báo cáo trải nghiệm người dùng của Chrome và người dùng thậm chí có thể không biết đây là iframe. Do đó, trải nghiệm được đo lường ở trang cấp cao nhất theo cách người dùng nhìn thấy.

Cấu trúc của một trang web có thể khiến dữ liệu trong CrUX trở nên phức tạp. Ví dụ: các ứng dụng trang đơn (SPA) có thể sử dụng lược đồ chuyển đổi tuyến dựa trên JavaScript để di chuyển giữa các trang, trái với việc điều hướng trang dựa trên neo truyền thống. Các hoạt động chuyển đổi này xuất hiện dưới dạng lượt xem trang mới đối với người dùng, nhưng đối với Chrome và các API nền tảng cơ bản, toàn bộ trải nghiệm đều được quy cho lượt xem trang ban đầu. Đây là hạn chế của các API nền tảng web gốc dùng để xây dựng CrUX. Hãy xem bài viết Tác động của kiến trúc SPA đến Các chỉ số quan trọng về trang web trên web.dev để biết thêm thông tin.

Người dùng

Để có được trải nghiệm tổng hợp trong tập dữ liệu CrUX, người dùng phải đáp ứng các tiêu chí sau:

  1. Bật báo cáo thống kê sử dụng.
  2. Đồng bộ hoá nhật ký duyệt web của trẻ.
  3. Chưa đặt Cụm mật khẩu đồng bộ hoá.
  4. Sử dụng nền tảng được hỗ trợ.

Sau đây là các nền tảng được hỗ trợ hiện tại:

  • Các phiên bản Chrome dành cho máy tính, bao gồm hệ điều hành Windows, MacOS, ChromeOS và Linux.
  • Các phiên bản Chrome dành cho Android, bao gồm cả ứng dụng gốc sử dụng Thẻ tuỳ chỉnhWebAPKs.

Có một vài ngoại lệ đáng chú ý không cung cấp dữ liệu cho tập dữ liệu CrUX:

  • Chrome trên iOS.
  • Ứng dụng Android gốc dùng WebView.
  • Các trình duyệt Chromium khác (ví dụ: Microsoft Edge).

Chrome không công bố dữ liệu về tỷ lệ người dùng đáp ứng các tiêu chí này. Bạn có thể tìm hiểu thêm về dữ liệu mà chúng tôi thu thập trong Sách trắng về quyền riêng tư của Chrome.

Accelerated Mobile Pages (AMP)

Các trang được tạo bằng AMP được đưa vào tập dữ liệu CrUX như mọi trang web khác. Kể từ bản phát hành CrUX vào tháng 6 năm 2020, các trang được phân phát qua Bộ nhớ đệm AMP và / hoặc hiển thị trong Trình xem AMP cũng được ghi lại và phân bổ cho URL trang của nhà xuất bản.

Chất lượng dữ liệu

Dữ liệu trong CrUX phải trải qua quá trình xử lý một chút để đảm bảo dữ liệu chính xác về mặt thống kê, có cấu trúc hợp lý và dễ truy vấn.

Lọc

Tập dữ liệu CrUX được lọc để đảm bảo dữ liệu được trình bày là hợp lệ về mặt thống kê. Điều này có thể ngăn toàn bộ trang hoặc nguồn gốc xuất hiện trong tập dữ liệu.

Ngoài các tiêu chí về tính đủ điều kiện áp dụng cho nguồn gốc và trang, tính năng lọc thêm được áp dụng cho các phân khúc trong dữ liệu:

Những nguồn gốc hoặc trang có hơn 20% tổng lưu lượng truy cập bị loại trừ do các kiểu kết hợp phương diện không đủ điều kiện sẽ bị loại trừ hoàn toàn khỏi tập dữ liệu.

Vì tập dữ liệu cấp toàn cầu bao gồm trải nghiệm người dùng từ tất cả các quốc gia, nên các tổ hợp phương diện không đáp ứng tiêu chí về mức độ phổ biến ở cấp quốc gia vẫn có thể được đưa vào ở cấp toàn cầu, miễn là đủ mức độ phổ biến.

Hiệu ứng mờ

Một phần nhỏ ngẫu nhiên được áp dụng cho tập dữ liệu để ngăn chặn kỹ thuật đảo ngược dữ liệu nhạy cảm, chẳng hạn như tổng lưu lượng truy cập. Điều này không ảnh hưởng đến độ chính xác của số liệu thống kê tổng hợp.

Chính xác

Hầu hết giá trị chỉ số trong tập dữ liệu CrUX đều được biểu thị dưới dạng biểu đồ của các giá trị và kích thước thùng, trong đó giá trị biểu đồ là một phần của tất cả các phân đoạn đi kèm có tổng bằng 1. Kích thước thùng là các số thực dấu phẩy động từ 1,0 đến 0,0001.

Chiều rộng của thùng biểu đồ được chuẩn hoá để đơn giản hoá việc truy vấn và trực quan hoá dữ liệu. Điều này có nghĩa là các thùng lớn có thể được chia thành các thùng nhỏ hơn, chia đều mật độ ban đầu để duy trì chiều rộng nhất quán của thùng.

Giấy phép

Các tập dữ liệu CrUX của Google được cấp phép theo Giấy phép quốc tế ghi công theo Creative Commons 4.0.