BigQuery에서 CrUX 데이터가 구성되는 방식을 알아봅니다.
소개
Chrome UX 보고서(CrUX)의 원시 데이터는 Google Cloud에서 호스팅되는 데이터베이스인 BigQuery에서 확인할 수 있습니다.
BigQuery의 CrUX를 통해 사용자는 예를 들어 추세 분석, 웹 기술 및 벤치마킹 도메인 비교 등 2017년으로 거슬러 올라가는 전체 데이터 세트를 직접 쿼리할 수 있습니다.
데이터는 월별 출시별로 구성되며 데이터를 간편하게 쿼리할 수 있도록 여러 요약 표가 제공됩니다.
BigQuery 데이터는 SQL 쿼리를 작성하지 않고도 이 데이터를 시각화할 수 있는 CrUX Dashboard의 기반이 됩니다.
데이터 세트 액세스
BigQuery를 사용하려면 Google Cloud 계정과 SQL에 대한 기본 지식이 필요합니다. BigQuery의 CrUX 데이터 세트는 BigQuery에서 제공하는 무료 등급의 한도 내에서 무료로 액세스하고 탐색할 수 있습니다. 무료 등급은 매월 갱신됩니다. 또한 신규 Google Cloud 사용자는 무료 등급 이상의 비용을 충당할 수 있는 가입 크레딧을 받을 수 있습니다. Google Cloud 프로젝트에 사용할 신용카드를 제공해야 합니다. 신용카드를 제공해야 하는 이유는 무엇인가요?를 참고하세요.
BigQuery를 처음 사용하는 경우 다음 단계에 따라 프로젝트를 설정하세요.
- Google Cloud 콘솔에서 프로젝트 만들기로 이동합니다.
- 새 프로젝트에 '내 Chrome UX 보고서'와 같은 이름을 지정하고 '만들기'를 클릭합니다.
- 메시지가 표시되면 결제 정보를 입력합니다.
- BigQuery의 CrUX 데이터 세트로 이동합니다.
이제 데이터 세트 쿼리를 시작할 준비가 되었습니다.
프로젝트 조직
BigQuery의 CrUX 데이터는 다음 달 둘째 주 화요일에 출시됩니다. 매월 chrome-ux-report.all
아래에 새 테이블로 출시됩니다. 또한 각 월의 요약 통계를 제공하는 여러 구체화된 테이블이 있습니다.
- `chrome-ux-report
자세한 테이블 스키마
각 국가의 원시 테이블과 all
데이터 세트는 연도 및 월별로 제공됩니다.
원시 테이블
원시 테이블에는 다음과 같은 스키마가 있습니다.
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
구체화된 테이블 스키마
구체화된 테이블은 여러 주요 측정기준별로 요약 데이터에 더 쉽게 액세스할 수 있도록 제공됩니다. 히스토그램은 제공되지 않으며 대신 성능 데이터가 성능 평가 및 75번째 백분위수 값별로 비율로 집계됩니다. 이 예에는 metrics_summary
테이블의 예시 행이 나와 있습니다.
yyyymm | 출처 | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1500 |
202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1500 |
이는 202204년 데이터 세트에서 https://example.com
의 실제 사용자 경험의 90.56% 가 양호한 LCP 기준을 충족했으며 대략적인 75번째 백분위수 LCP 값이 1,600ms였음을 보여줍니다. 이전 달에 비해 다소 느립니다.
다음과 같은 4개의 구체화된 테이블이 제공됩니다.
metrics_summary
- 월 및 출처별 주요 측정항목
device_summary
- 월별, 출처, 기기 유형별 주요 측정항목
country_summary
- 월별, 출처, 기기 유형, 국가별 주요 측정항목
origin_summary
- 데이터 세트에 포함된 모든 출처의 목록
metrics_summary
metrics_summary
테이블에는 각 출처 및 각 월별 데이터 세트에 대한 요약 통계가 포함됩니다.
yyyymm
- 데이터 수집 기간의 월
origin
- 사이트 출처의 URL
rank
- 대략적인 인기 순위(2021년 3월 기준)
[small|medium|large]_cls
- CLS 기준 트래픽 비율
[fast|avg|slow]_<metric>
- 실적 기준별 트래픽 비율
p75_<metric>
- 성능 측정항목의 75번째 백분위수 값(밀리초)
notification_permission_[accept|deny|ignore|dismiss]
- 알림 권한 동작 비율
[desktop|phone|tablet]Density
- 폼 팩터별 트래픽 비율
[_4G|_3G|_2G|slow2G|offline]Density
- 효과적인 연결 유형별 트래픽 비율
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- 탐색 유형의 비율
device_summary
device_summary
테이블에는 월, 출처, 국가, 기기별로 집계된 통계가 포함됩니다. metrics_summary
열 외에도 다음과 같은 항목이 있습니다.
device
- 기기 폼 팩터
country_summary
country_summary
테이블에는 월별, 출처, 국가, 기기별로 집계된 통계가 포함되어 있습니다. metrics_summary
열 외에도 다음과 같은 항목이 있습니다.
origin_summary
origin_summary
테이블에는 CrUX 데이터 세트의 모든 출처 목록이 포함됩니다. 이 테이블은 매달 데이터 세트의 최신 출처 목록으로 업데이트되며 origin
이라는 단일 열이 있습니다.
실험용 데이터 세트
실험용 데이터 세트의 테이블은 기본 YYYYMM
테이블의 정확한 사본이지만 파티션 나누기 및 클러스터링과 같이 더 빠르고 간단하며 저렴한 쿼리를 작성할 수 있는 최신 고급 BigQuery 기능을 활용합니다.
country
experimental.country
데이터 세트에는 데이터 세트 날짜에 대한 추가 yyyymm
열이 있는 country_CC
데이터 세트의 집계된 데이터가 포함되어 있습니다. 스키마는 날짜 및 country_code
열이 추가된 원시 테이블과 동일하므로 월별 테이블을 조인하지 않고도 시간 경과에 따른 국가 수준 비교 쿼리를 실행할 수 있습니다.
global
experimental.global
데이터 세트에는 all
데이터 세트의 집계된 데이터와 데이터 세트 날짜의 추가 yyyymm
열이 포함되어 있습니다. 스키마는 날짜가 추가된 원시 테이블과 동일하므로 월별 테이블을 조인하지 않고도 시간 경과 비교 쿼리를 실행할 수 있습니다.