이 섹션에서는 CrUX에서 사용자 환경 데이터를 수집하고 구성하는 방법을 설명합니다.
자격 요건
CrUX 데이터 세트의 핵심은 개별 사용자 환경이며, 이는 페이지 수준 및 출처 수준 분포로 집계됩니다. 이 섹션에서는 사용자 자격 요건과 데이터 세트에 포함될 페이지 및 출처의 요구사항을 설명합니다. PageSpeed Insights 및 CrUX API에서 제공되는 페이지 수준 데이터에 환경을 포함하려면 사용자, 출처 및 페이지의 모든 자격 기준을 충족해야 합니다. 사용자 및 출처 기준은 충족하지만 페이지 기준은 충족하지 않는 환경은 모든 CrUX 데이터 소스에서 제공되는 출처 수준 데이터에 포함되지 않습니다.
페이지와 출처는 시간이 지남에 따라 자격 요건이 변경되면 데이터 세트에 자동으로 포함되거나 삭제됩니다. 현재는 포함을 위해 페이지 또는 출처를 수동으로 제출할 수 없습니다.
공개적으로 검색 가능
CrUX 데이터 세트에 포함되려면 페이지가 공개적으로 검색 가능해야 합니다.
페이지는 검색엔진과 동일한 색인 생성 가능성 기준을 사용하여 공개적으로 검색 가능한 것으로 판단됩니다.
출처 데이터 세트의 루트 페이지를 포함하여 다음 조건 중 하나라도 충족되면 페이지가 검색 가능성 요구사항을 충족할 수 없습니다.
- 페이지가 리디렉션 후
상태 코드가 아닌
200HTTP로 제공됩니다. - 페이지가 HTTP
X-Robots-Tag: noindex헤더 또는 이와 동등한 헤더로 제공됩니다. - 문서에
<meta name="robots" content="noindex">메타 태그 또는 이와 동등한 태그가 포함되어 있습니다.
사이트의 색인 생성 상태 개요는 Google Search Console 을 참고하세요.
충분히 인기 있음
페이지는 방문자 수가 최소한인 경우 충분히 인기 있는 것으로 판단됩니다. 출처는 모든 페이지에서 방문자 수가 최소한인 경우 충분히 인기 있는 것으로 판단됩니다. 정확한 숫자는 공개되지 않지만 포함된 페이지의 통계적 분포를 확신할 수 있는 충분한 샘플을 확보하기 위해 선택되었습니다. 최소 숫자는 페이지와 출처에 동일합니다.
인기도 기준점을 충족하지 않는 페이지와 출처는 CrUX 데이터 세트에 포함되지 않습니다.
출처
출처는
https://www.example.com과 같은 URL로 주소를 지정할 수 있는 전체 웹사이트를 나타냅니다. 출처가 CrUX 데이터 세트에 포함되려면 다음 두 가지 요구사항을 충족해야 합니다.
Lighthouse 감사를 실행하고 SEO 카테고리 결과를 확인하여 출처를 검색할 수 있는지 확인할 수 있습니다. 루트 페이지가 페이지가 색인 생성을 차단함 또는 페이지에 실패한 HTTP 상태 코드가 있음 감사를 통과하지 못하면 사이트를 검색할 수 없습니다.
출처가 공개적으로 검색 가능한 것으로 판단되면 개별 페이지 검색 가능성과 관계없이 해당 출처의 모든 페이지에서 자격 보유자 환경이 출처 수준에서 집계됩니다. 이러한 모든 환경은 출처의 인기도 요구사항에 포함됩니다.
쿼리 목적으로 CrUX 데이터 세트의 모든 출처는 소문자입니다.
페이지
페이지 가 CrUX 데이터 세트에 포함되기 위한 요구사항은 출처와 동일합니다.
Lighthouse 감사를 실행하고 SEO 카테고리 결과를 확인하여 페이지를 검색할 수 있는지 확인할 수 있습니다. 페이지가 페이지가 색인 생성을 차단함 또는 페이지에 실패한 HTTP 상태 코드가 있음 감사를 통과하지 못하면 페이지를 검색할 수 없습니다.
일부 사용자에게 페이지가 공개적으로 검색 가능하지만 일부 상황에서 성공하지 못한 HTTP 상태를 반환하는 경우 이러한 환경은 CrUX에 포함되지 않습니다.
페이지에는 일반적으로 ?utm_medium=email과 같은 쿼리 문자열 매개변수 및 #main과 같은 프래그먼트를 포함하여 URL에 추가 식별자가 있습니다. 이러한 식별자는 페이지의 모든 사용자 환경이 함께 집계되도록 CrUX 데이터 세트의 URL에서 삭제됩니다. 이는 동일한 페이지에 대해 연결되지 않은 URL 변형이 많은 경우 인기도 기준점을 충족하지 않는 페이지에 유용합니다. 드물지만 매개변수 ?productID=101 및 ?productID=102가 서로 다른 페이지를 나타내는 경우와 같이 서로 다른 페이지의 환경이 예기치 않게 함께 그룹화될 수 있습니다.
CrUX의 페이지는 최상위 페이지를 기준으로 측정됩니다. iframe으로 포함된 페이지는 CrUX에서 별도로 보고되지 않지만 최상위 페이지의 측정항목에 기여합니다. 예를 들어 https://www.example.com/page.html이 iframe에 https://www.example.com/frame.html을 삽입하는 경우 page.html은 다른 자격 기준에 따라 CrUX에 표시되지만 frame.html은 표시되지 않습니다. 그리고 frame.html의 CLS가 좋지 않으면 page.html의 CLS를 측정할 때 CLS가 포함됩니다. CrUX는 Chrome 사용자 환경 보고서이며 사용자는 iframe이라는 것을 인식하지 못할 수도 있습니다. 따라서 환경은 사용자가 보는 방식에 따라 최상위 페이지에서 측정됩니다.
웹사이트의 아키텍처는 CrUX에서 데이터가 표시되는 방식을 복잡하게 만들 수 있습니다. 예를 들어 단일 페이지 앱 (SPA)은 기존 앵커 기반 페이지 탐색과 달리 JavaScript 기반 경로 전환 스키마를 사용하여 페이지 간에 이동할 수 있습니다. 이러한 전환은 사용자에게 새 페이지 조회(수)로 표시되지만 Chrome 및 기본 플랫폼 API의 경우 전체 환경이 초기 페이지 조회(수)에 기인합니다. 이는 CrUX가 빌드되는 웹 플랫폼 API의 제한사항입니다. 자세한 내용은 web.dev의 SPA 아키텍처가 웹의 Core Web Vitals에 미치는 영향을 참고하세요.
사용자
사용자 의 환경이 CrUX 데이터 세트에 집계되려면 다음 기준을 충족해야 합니다.
- 사용 통계 보고를 사용 설정합니다.
- 브라우저 기록을 동기화합니다.
- 동기화 암호가 설정되어 있지 않습니다.
- 지원되는 플랫폼을 사용합니다.
현재 지원되는 플랫폼은 다음과 같습니다.
- Windows, macOS, ChromeOS, Linux 운영체제를 포함한 Chrome의 데스크톱 버전
- WebAPKs
CrUX 데이터 세트에 데이터를 제공하지 않는 몇 가지 주목할 만한 예외가 있습니다.
- iOS용 Chrome
- WebView를 사용하는 Android 앱
- 기타 Chromium 브라우저 (예: Microsoft Edge)
Chrome은 이러한 기준을 충족하는 사용자의 비율에 관한 데이터를 게시하지 않습니다. Chrome에서 수집하는 데이터에 관해 자세히 알아보세요.
Accelerated Mobile Pages (AMP)
AMP로 빌드된 페이지는 다른 웹페이지와 마찬가지로 CrUX 데이터 세트에 포함됩니다. 2020년 6월 CrUX 출시를 기준으로 AMP Cache를 사용하여 제공되거나 AMP 뷰어에서 렌더링되는 페이지도 캡처되어 게시자의 페이지 URL에 기인합니다.
데이터 품질
CrUX의 데이터는 통계적으로 정확하고 잘 구성되어 있으며 쿼리하기 쉽도록 약간의 처리를 거칩니다.
필터링
CrUX 데이터 세트는 표시되는 데이터가 통계적으로 유효하도록 필터링됩니다. 이렇게 하면 전체 페이지 또는 출처가 데이터 세트에 표시되지 않을 수 있습니다.
출처 및 페이지에 적용되는 자격 기준 외에도 데이터 내의 세그먼트에 추가 필터링이 적용됩니다.
측정기준의 부적격 조합으로 인해 총 트래픽의 20% 이상이 제외된 출처 또는 페이지는 데이터 세트에서 완전히 제외됩니다.
전역 수준 데이터 세트는 모든 국가의 사용자 환경을 포함하므로 국가 수준에서 인기도 기준점을 충족하지 않는 측정기준 조합은 인기도가 충분한 경우 전역 수준에서 계속 포함될 수 있습니다.
퍼징
총 트래픽 볼륨과 같은 민감한 정보의 리버스 엔지니어링을 방지하기 위해 데이터 세트에 약간의 무작위성이 적용됩니다. 이는 집계 통계의 정확성에 영향을 미치지 않습니다.
정밀도
CrUX 데이터 세트 내의 대부분의 측정항목 값은 히스토그램 값이 포함된 모든 세그먼트의 합이 1인 값 및 구간 크기의 히스토그램으로 표시됩니다. 구간 크기는 1.0~0.0001 사이의 부동 소수점 숫자입니다.
히스토그램 구간 너비는 정규화되어 데이터를 더 쉽게 쿼리하고 시각화할 수 있습니다. 즉, 더 큰 구간은 더 작은 구간으로 분할될 수 있으며, 일관된 구간 너비를 유지하기 위해 원래 밀도를 동일하게 공유합니다.
라이선스
Google의 CrUX 데이터 세트는 크리에이티브 커먼즈 저작자표시 4.0 국제 라이선스에 따라 제공됩니다.