Phương pháp CrUX

Phần này trình bày cách CrUX thu thập và sắp xếp dữ liệu về trải nghiệm người dùng.

Điều kiện sử dụng

Cốt lõi của tập dữ liệu CrUX là trải nghiệm người dùng cá nhân, được tổng hợp thành các bản phân phối ở cấp độ trang và cấp độ gốc. Phần này ghi lại điều kiện của người dùng cũng như các yêu cầu để đưa trang và nguồn gốc vào tập dữ liệu. Bạn phải đáp ứng mọi tiêu chí thì mới có thể đưa trải nghiệm vào dữ liệu cấp trang trong PageSpeed Insights và CrUX API: Người dùng, Nguồn gốcTrang. Những trải nghiệm đáp ứng tiêu chí về Người dùng và Nguồn gốc nhưng không đáp ứng Trang sẽ không được đưa vào dữ liệu ở cấp độ gốc có trong tất cả các nguồn dữ liệu CrUX.

Các trang và nguồn gốc sẽ tự động được thêm vào hoặc bị xoá khỏi tập dữ liệu nếu điều kiện của các trang và nguồn gốc đó thay đổi theo thời gian. Hiện tại, bạn không thể gửi trang hoặc nguồn gốc theo cách thủ công để đưa vào Google Tin tức.

Có thể tìm thấy công khai

Trang phải có thể tìm thấy công khai để được xem xét đưa vào tập dữ liệu CrUX.

Một trang được xác định là có thể tìm thấy công khai bằng cách sử dụng cùng các tiêu chí về khả năng lập chỉ mục như các công cụ tìm kiếm.

Trang không thể đáp ứng yêu cầu về khả năng phát hiện nếu đáp ứng bất kỳ điều kiện nào sau đây, bao gồm cả trang gốc cho tập dữ liệu gốc:

  • Trang được phân phát bằng một mã trạng thái HTTP thay vì 200 (sau khi chuyển hướng).
  • Trang được phân phát bằng tiêu đề HTTP X-Robots-Tag: noindex hoặc tiêu đề tương đương.
  • Tài liệu này chứa thẻ meta <meta name="robots" content="noindex"> hoặc thẻ tương đương.

Vui lòng tham khảo Google Search Console để biết thông tin tổng quan về trạng thái lập chỉ mục trang web của bạn.

Đủ phổ biến

Một trang được xác định là đủ phổ biến nếu có số lượng khách truy cập tối thiểu. Một nguồn gốc được xác định là đủ phổ biến nếu có số lượng khách truy cập tối thiểu trên tất cả các trang của nguồn đó. Chúng tôi không tiết lộ con số chính xác, nhưng số liệu này được chọn nhằm đảm bảo rằng chúng tôi có đủ số lượng mẫu để tin tưởng vào kết quả phân phối thống kê của các trang được đưa vào. Số lượng tối thiểu cho các trang và nguồn gốc là như nhau.

Những trang và nguồn gốc không đáp ứng ngưỡng về mức độ phổ biến sẽ không được đưa vào tập dữ liệu CrUX.

Điểm gốc

Nguồn gốc đại diện cho toàn bộ trang web, có thể xác định bằng một URL như https://www.example.com. Để được đưa vào tập dữ liệu CrUX, một nguồn gốc phải đáp ứng 2 yêu cầu:

  1. Có thể tìm thấy công khai
  2. Khá phổ biến

Bạn có thể xác minh rằng nguồn gốc của bạn có thể tìm thấy được bằng cách chạy công cụ kiểm tra Lighthouse và xem kết quả của danh mục SEO. Không thể tìm thấy trang web của bạn nếu trang gốc của bạn không thành công do quy trình kiểm tra Trang bị chặn lập chỉ mục hoặc Trang có mã trạng thái HTTP không thành công.

Nếu một nguồn gốc được xác định là có thể tìm thấy công khai, thì trải nghiệm người dùng đủ điều kiện trên tất cả các trang của nguồn gốc đó sẽ được tổng hợp ở cấp độ gốc, bất kể khả năng phát hiện trang của từng trang. Tất cả những trải nghiệm này đều được tính vào yêu cầu về mức độ phổ biến của nguồn gốc.

Để truy vấn, hãy lưu ý rằng tất cả nguồn gốc trong tập dữ liệu CrUX đều là chữ thường.

Trang

Các yêu cầu để một trang được đưa vào tập dữ liệu CrUX cũng giống như các nguồn gốc:

  1. Có thể tìm thấy công khai
  2. Khá phổ biến

Bạn có thể xác minh rằng một trang có thể tìm thấy được bằng cách chạy công cụ kiểm tra Lighthouse và xem kết quả của danh mục SEO. Không thể tìm thấy trang của bạn nếu trang không thành công do cơ chế Trang bị chặn lập chỉ mục hoặc kiểm tra Trang có mã trạng thái HTTP không thành công.

Nếu một số người dùng có thể tìm thấy trang công khai, nhưng trả về trạng thái HTTP không thành công trong một số trường hợp, thì những trải nghiệm đó sẽ không được tính vào CrUX.

Các trang thường có giá trị nhận dạng bổ sung trong URL, bao gồm cả các tham số chuỗi truy vấn như ?utm_medium=email và các mảnh như #main. Các giá trị nhận dạng này sẽ bị xoá khỏi URL trong tập dữ liệu CrUX để tổng hợp tất cả trải nghiệm người dùng trên trang đó. Điều này rất hữu ích cho những trang sẽ không đáp ứng được ngưỡng về mức độ phổ biến nếu có nhiều biến thể URL rời rạc trên cùng một trang. Xin lưu ý rằng trong một số ít trường hợp, thao tác này có thể đột ngột nhóm các trải nghiệm trên các trang riêng biệt lại với nhau; ví dụ: nếu tham số ?productID=101?productID=102 đại diện cho các trang khác nhau.

Các trang trong CrUX được đo lường dựa trên trang cấp cao nhất. Các trang được đưa vào dưới dạng iframe không được báo cáo riêng trong CrUX, nhưng chúng đóng góp vào các chỉ số của trang cấp cao nhất. Ví dụ: nếu https://www.example.com/page.html nhúng https://www.example.com/frame.html vào một iframe, thì page.html sẽ được thể hiện trong CrUX (tuân theo các tiêu chí khác), nhưng frame.html sẽ không hiển thị. Còn nếu frame.htmlCLS thấp, thì CLS sẽ được tính khi đo lường CLS cho page.html. CrUX là Báo cáo Trải nghiệm người dùng trên Chrome và người dùng thậm chí có thể không biết đây là iframe. Do đó, trải nghiệm sẽ được đo lường ở trang cấp cao nhất – theo cách người dùng nhìn thấy.

Cấu trúc của một trang web có thể khiến cách dữ liệu được thể hiện trong CrUX trở nên phức tạp. Ví dụ: các ứng dụng trang đơn (SPA) có thể sử dụng lược đồ chuyển đổi định tuyến dựa trên JavaScript để di chuyển giữa các trang, thay vì điều hướng trang thông thường dựa trên neo. Với người dùng, những chuyển đổi này xuất hiện dưới dạng lượt xem trang mới, nhưng đối với Chrome và các API nền tảng cơ bản, toàn bộ trải nghiệm được quy cho lượt xem trang ban đầu. Đây là hạn chế của các API nền tảng web mà CrUX được xây dựng. Hãy xem bài viết Cách kiến trúc SPA ảnh hưởng đến Chỉ số quan trọng chính của trang web trên web.dev để biết thêm thông tin.

Người dùng

Để có được trải nghiệm tổng hợp trong tập dữ liệu CrUX, người dùng phải đáp ứng các tiêu chí sau:

  1. Bật tính năng báo cáo số liệu thống kê về việc sử dụng.
  2. Đồng bộ hoá nhật ký duyệt web của trẻ.
  3. Chưa đặt Cụm mật khẩu đồng bộ hoá.
  4. Hãy sử dụng một nền tảng được hỗ trợ.

Các nền tảng hiện được hỗ trợ là:

  • Các phiên bản Chrome dành cho máy tính, bao gồm hệ điều hành Windows, macOS, ChromeOS và Linux.
  • Phiên bản Chrome dành cho Android, bao gồm cả ứng dụng di động sử dụng Thẻ tuỳ chỉnhWebAPKs.

Có một vài trường hợp ngoại lệ đáng chú ý không cung cấp dữ liệu cho tập dữ liệu CrUX:

  • Chrome trên iOS.
  • Ứng dụng Android dùng WebView.
  • Các trình duyệt Chromium khác (ví dụ: Microsoft Edge).

Chrome không công bố dữ liệu về tỷ lệ người dùng đáp ứng các tiêu chí này. Bạn có thể tìm hiểu thêm về dữ liệu chúng tôi thu thập trong Sách trắng về quyền riêng tư của Chrome.

Accelerated Mobile Pages (AMP)

Các trang được tạo bằng AMP được đưa vào tập dữ liệu CrUX như bất kỳ trang web nào khác. Kể từ bản phát hành CrUX vào tháng 6 năm 2020, các trang được phân phát bằng Bộ nhớ đệm AMP và / hoặc hiển thị trong Trình xem AMP cũng sẽ được thu thập và phân bổ cho URL trang của nhà xuất bản.

Chất lượng dữ liệu

Dữ liệu trong CrUX trải qua một lượng nhỏ xử lý để đảm bảo rằng dữ liệu đó chính xác về mặt thống kê, có cấu trúc hợp lý và dễ truy vấn hơn.

Lọc

Tập dữ liệu CrUX được lọc để đảm bảo rằng dữ liệu được trình bày có giá trị thống kê. Thao tác này có thể loại trừ toàn bộ trang hoặc nguồn gốc xuất hiện trong tập dữ liệu.

Ngoài các tiêu chí về tính đủ điều kiện được áp dụng cho nguồn gốc và trang, tính năng lọc thêm được áp dụng cho các phân đoạn trong dữ liệu:

Những nguồn gốc hoặc trang có hơn 20% tổng lưu lượng truy cập bị loại trừ do các tổ hợp phương diện không đủ điều kiện sẽ bị loại trừ hoàn toàn khỏi tập dữ liệu.

Do tập dữ liệu cấp toàn cầu bao gồm trải nghiệm người dùng ở tất cả các quốc gia, nên những tổ hợp phương diện không đáp ứng tiêu chí về mức độ phổ biến ở cấp quốc gia vẫn có thể được đưa vào ở cấp toàn cầu, miễn là có đủ mức độ phổ biến.

Làm mờ

Một lượng nhỏ dữ liệu ngẫu nhiên được áp dụng cho tập dữ liệu để ngăn kỹ thuật đảo ngược dữ liệu nhạy cảm, chẳng hạn như tổng lưu lượng truy cập. Điều này không ảnh hưởng đến độ chính xác của thống kê tổng hợp.

Chính xác

Hầu hết các giá trị chỉ số trong tập dữ liệu CrUX được biểu thị dưới dạng biểu đồ của các giá trị và kích thước thùng, trong đó giá trị của biểu đồ là một phần của tất cả các phân đoạn được đưa vào với tổng bằng 1. Kích thước thùng là các số có dấu phẩy động từ 1,0 đến 0,0001.

Chiều rộng thùng biểu đồ được chuẩn hoá để đơn giản hoá việc truy vấn và trực quan hoá dữ liệu. Điều này có nghĩa là các thùng lớn hơn có thể được chia thành các thùng nhỏ hơn. Những thùng này chia đều mật độ ban đầu để duy trì chiều rộng nhất quán cho thùng.

Giấy phép

Các tập dữ liệu CrUX của Google được cấp phép theo Giấy phép quốc tế Ghi nhận tác giả theo Creative Commons 4.0.