이 섹션에서는 CrUX에서 사용자 환경 데이터를 수집하고 구성하는 방법을 설명합니다.
자격 요건
CrUX 데이터 세트의 핵심은 페이지 수준 및 출처 수준 분포로 집계되는 개별 사용자 환경입니다. 이 섹션에서는 데이터 세트에 포함할 페이지 및 출처에 관한 사용자 자격요건과 요구사항을 설명합니다. PageSpeed Insights 및 CrUX API에서 제공되는 페이지 수준 데이터(사용자, 원본, 페이지)에 환경을 포함하려면 모든 자격 기준을 충족해야 합니다. 사용자 및 출처 기준을 충족하지만 페이지는 충족하지 않는 환경은 모든 CrUX 데이터 소스에서 제공되는 출처 수준 데이터에 포함되지 않습니다.
시간이 지남에 따라 자격요건이 변경되면 페이지와 출처가 자동으로 데이터 세트에 포함되거나 삭제됩니다. 현재는 포함할 페이지나 출처를 수동으로 제출할 수 없습니다.
공개적으로 검색 가능
CrUX 데이터 세트에 포함되려면 페이지를 공개적으로 검색할 수 있어야 합니다.
페이지는 검색엔진과 동일한 색인 생성 가능 여부 기준을 사용하여 공개적으로 검색할 수 있는 것으로 판단됩니다.
원본 데이터 세트의 루트 페이지를 포함하여 다음 조건 중 하나라도 충족되는 경우 페이지는 검색 가능 여부 요구사항을 충족할 수 없습니다.
- 페이지가 (리디렉션 후)
200
이 아닌 HTTP 상태 코드로 제공됩니다. - 페이지는 HTTP
X-Robots-Tag: noindex
헤더 또는 이와 동등한 헤더로 제공됩니다. - 문서에
<meta name="robots" content="noindex">
메타 태그 또는 이와 동등한 태그가 포함됩니다.
사이트의 색인 생성 상태에 대한 개요는 Google Search Console을 참고하세요.
충분히 인기 있음
최소 방문자 수가 있어야 페이지가 충분히 인기 있는 것으로 간주됩니다. 출처는 모든 페이지의 방문자 수가 최소 기준일 때 충분히 인기 있는 것으로 간주됩니다. 정확한 수치는 공개되지 않지만 포함된 페이지의 통계 분포를 확신할 수 있을 만큼 충분한 샘플이 있는지 확인하기 위해 이 같은 통계를 선택했습니다. 페이지와 출처의 최소 개수는 동일합니다.
인기도 기준을 충족하지 않는 페이지와 출처는 CrUX 데이터 세트에 포함되지 않습니다.
출발지
출처는 https://www.example.com
과 같은 URL로 주소를 지정할 수 있는 전체 웹사이트를 나타냅니다. 출처가 CrUX 데이터 세트에 포함되려면 다음 두 가지 요구사항을 충족해야 합니다.
Lighthouse 감사를 실행하고 검색엔진 최적화 카테고리 결과를 확인하여 출처를 검색할 수 있는지 확인할 수 있습니다. 루트 페이지가 페이지 색인 생성이 차단됨 또는 페이지에 실패한 HTTP 상태 코드가 있음 감사에 실패하면 사이트를 검색할 수 없습니다.
출처가 공개적으로 검색 가능한 것으로 확인되면 해당 출처의 모든 페이지에서 요건을 충족하는 사용자 환경이 개별 페이지 검색 가능 여부와 관계없이 출처 수준에서 집계됩니다. 이러한 모든 환경은 출처의 인기 요건에 반영됩니다.
쿼리를 위해 CrUX 데이터 세트의 모든 출처는 소문자입니다.
페이지
CrUX 데이터 세트에 포함되는 페이지의 요구사항은 출처와 동일합니다.
Lighthouse 감사를 실행하고 검색엔진 최적화 카테고리 결과를 확인하여 페이지가 검색 가능한지 확인할 수 있습니다. 페이지 색인 생성이 차단됨 또는 페이지에 실패한 HTTP 상태 코드가 있음 감사에 실패하면 페이지가 표시되지 않습니다.
일부 사용자는 페이지를 공개적으로 검색할 수 있지만 상황에 따라 HTTP 상태를 반환하지 않는 경우 해당 환경은 CrUX에 포함되지 않습니다.
페이지는 일반적으로 URL에 ?utm_medium=email
와 같은 쿼리 문자열 매개변수 및 #main
와 같은 프래그먼트를 비롯한 추가 식별자가 있습니다. 이러한 식별자는 CrUX 데이터 세트의 URL에서 제거되므로 페이지의 모든 사용자 경험이 함께 집계됩니다. 이 기능은 동일한 페이지에 대해 연결되지 않은 URL 변형이 많은 경우 인기도 기준을 충족하지 못하는 페이지에 유용합니다. 드문 경우지만 ?productID=101
매개변수와 ?productID=102
매개변수가 서로 다른 페이지를 나타내는 경우와 같이 고유한 페이지의 환경이 예기치 않게 그룹화될 수 있습니다.
CrUX의 페이지는 최상위 페이지를 기준으로 측정됩니다. iframe으로 포함된 페이지는 CrUX에 별도로 보고되지 않지만, 최상위 페이지의 측정항목에 기여합니다. 예를 들어 https://www.example.com/page.html
가 iframe에 https://www.example.com/frame.html
를 삽입하면 page.html
는 CrUX로 표시되지만 (다른 자격 기준이 적용됨) frame.html
은 표시되지 않습니다. frame.html
의 CLS가 낮으면 page.html
의 CLS를 측정할 때 CLS가 포함됩니다. CrUX는 Chrome 사용자 환경 보고서이며 사용자는 이 보고서가 iframe이라는 사실을 인지하지 못할 수도 있습니다. 따라서 사용자 경험은 사용자에게 표시되는 방식에 따라 최상위 페이지에서 측정됩니다.
웹사이트의 아키텍처는 데이터가 CrUX에서 표시되는 방식을 복잡하게 할 수 있습니다. 예를 들어 단일 페이지 앱 (SPA)은 기존의 앵커 기반 페이지 탐색과 달리 JavaScript 기반 경로 전환 스키마를 사용하여 페이지 간에 이동할 수 있습니다. 이러한 전환은 사용자에게 새로운 페이지 뷰로 표시되지만, Chrome과 기본 플랫폼 API에서는 전체 경험이 초기 페이지 조회로 귀속됩니다. 이는 CrUX가 빌드되는 웹 플랫폼 API의 제한사항입니다. 자세한 내용은 web.dev에서 SPA 아키텍처가 Core Web Vitals에 미치는 영향을 참고하세요.
사용자
사용자가 CrUX 데이터 세트에 사용자 경험을 집계하려면 다음 기준을 충족해야 합니다.
현재 지원되는 플랫폼은 다음과 같습니다.
- Windows, macOS, ChromeOS, Linux 운영체제를 포함한 Chrome 데스크톱 버전
- 맞춤 탭 및 WebAPKs를 사용하는 모바일 앱을 포함한 Android 버전의 Chrome
CrUX 데이터 세트에 데이터를 제공하지 않는 몇 가지 주목할 만한 예외가 있습니다.
- iOS의 Chrome.
- WebView를 사용하는 Android 앱
- 기타 Chromium 브라우저 (예: Microsoft Edge)
Chrome은 이 기준을 충족하는 사용자 비율에 대한 데이터를 게시하지 않습니다. Chrome 개인 정보 보호 백서에서 Google이 수집하는 데이터에 관해 자세히 알아보세요.
Accelerated Mobile Pages(AMP)
AMP로 작성된 페이지는 다른 웹페이지와 마찬가지로 CrUX 데이터 세트에 포함됩니다. 2020년 6월 CrUX 출시부터 AMP Cache를 사용하여 게재되거나 AMP 뷰어에서 렌더링된 페이지도 캡처되며 게시자의 페이지 URL을 출처로 표시합니다.
데이터 품질
CrUX의 데이터는 소량의 처리를 거쳐 통계적으로 정확하고 잘 구조화되어 있으며 쿼리하기 쉽습니다.
필터링
제시된 데이터가 통계적으로 유효하도록 CrUX 데이터세트가 필터링됩니다. 이렇게 하면 전체 페이지 또는 출처가 데이터 세트에 표시되지 않을 수 있습니다.
출처와 페이지에 적용되는 자격 기준 외에 데이터 내의 세그먼트에는 추가 필터링이 적용됩니다.
측정기준의 부적격한 조합으로 인해 제외된 출처 또는 페이지가 총 트래픽의 20% 를 초과하는 경우 데이터 세트에서 완전히 제외됩니다.
글로벌 수준 데이터 세트에는 모든 국가의 사용자 환경이 포함되므로, 인기도가 충분하다면 국가 수준의 인기도 기준을 충족하지 않는 측정기준의 조합도 전 세계 수준에 포함될 수 있습니다.
퍼징
총 트래픽 볼륨과 같은 민감한 정보의 리버스 엔지니어링을 방지하기 위해 데이터 세트에 소량의 무작위성이 적용됩니다. 이는 합산 통계의 정확성에 영향을 주지 않습니다.
정밀도
CrUX 데이터 세트 내 대부분의 측정항목 값은 값 및 구간 크기의 히스토그램으로 표시되며, 여기서 히스토그램 값은 포함된 모든 세그먼트의 합계가 1인 비율입니다. 구간 크기는 1.0과 0.0001 사이의 부동 소수점 수입니다.
데이터 쿼리 및 시각화를 간소화하기 위해 히스토그램 빈 너비가 정규화됩니다. 즉, 구간 너비를 일관되게 유지하기 위해 큰 구간이 작은 구간으로 분할되어 원래 밀도를 동일하게 공유할 수 있습니다.
라이선스
Google의 CrUX 데이터 세트는 크리에이티브 커먼즈 저작자 표시 4.0 국제 라이선스에 따라 라이선스가 부여됩니다.