Raport na temat użytkowania Chrome w BigQuery

Dowiedz się, jak dane z tego pliku są ustrukturyzowane w BigQuery.

Wprowadzenie

Dane nieprzetworzone, na których opiera się raport UX Chrome (CrUX), są dostępne w BigQuery, czyli w bazie danych hostowanej w Google Cloud.

CrUX w BigQuery umożliwia użytkownikom bezpośrednie wysyłanie zapytań do pełnego zbioru danych obejmującego dane z lat 2017 i wcześniej, np. w celu analizowania trendów, porównywania technologii internetowych i porównywania domen.

Dane są uporządkowane według miesięcznej wersji, a także w formie kilku tabel podsumowania, które ułatwiają wykonywanie dotyczących ich zapytań.

Dane z BigQuery stanowią podstawę panelu Crux, który umożliwia wizualizację tych danych bez konieczności pisania zapytań SQL.

Dostęp do zbioru danych

Korzystanie z BigQuery wymaga konta Google Cloud i podstawowej znajomości języka SQL. Dostęp do zbioru danych na temat użytkowania Chrome w BigQuery jest bezpłatny. Możesz go przeglądać i poznawać w ramach poziomu bezpłatnego, który jest odnawiany co miesiąc i dostarczany przez BigQuery. Oprócz tego nowi użytkownicy Google Cloud mogą kwalifikować się do otrzymania środków na rejestrację, które pokryją wydatki wykraczające poza poziom bezpłatny. Pamiętaj, że na potrzeby projektu Google Cloud należy podać kartę kredytową. Więcej informacji znajdziesz w artykule Dlaczego muszę podać kartę kredytową?.

Jeśli korzystasz z BigQuery po raz pierwszy, wykonaj te czynności, aby skonfigurować projekt:

  1. W konsoli Google Cloud kliknij Utwórz projekt.
  2. Nadaj nowemu projektowi nazwę, np. „Mój raport UX w Chrome”, i kliknij Utwórz.
  3. Podaj informacje rozliczeniowe, jeśli pojawi się taka prośba.
  4. Otwórz w BigQuery zbiór danych CRUX.

Teraz możesz zacząć tworzyć zapytania dotyczące zbioru danych.

Organizacja projektu

Dane na temat użytkowania Chrome w BigQuery są udostępniane w drugi wtorek następnego miesiąca. Każdy miesiąc jest udostępniany jako nowa tabela w subskrypcji chrome-ux-report.all. Dostępne są też liczne zmaterializowane tabele, które zawierają podsumowanie statystyk za każdy miesiąc.

Szczegółowy schemat tabeli

Tabele nieprzetworzone dla poszczególnych krajów i zbiór danych all są podawane według roku i miesiąca.

Tabele nieprzetworzone

Tabele nieprzetworzone mają ten schemat:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schemat tabeli zmaterializowanej

Tabela zagregowana jest udostępniana, aby ułatwić dostęp do danych podsumowania według kilku kluczowych wymiarów. Nie podano histogramów. Dane o wydajności są natomiast agregowane do ułamków według oceny wydajności i wartości 75 centyla. W tym przykładzie pokazano kilka przykładowych wierszy z tabeli metrics_summary:

rrrrmm pochodzenie fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

To pokazuje, że w zbiorze danych z 202204 r. 90, 56% rzeczywistych użytkowników https://example.com spełniało kryteria dobrego LCP,a przybliżona wartość LCP w 75. percentylu wynosiła 1600 ms. To nieco wolniejsze tempo niż w poprzednich miesiącach.

Dostępne są cztery tabele zmaterializowane:

metrics_summary
kluczowe dane według miesiąca i źródła
device_summary
kluczowe dane według miesiąca, źródła i typu urządzenia
country_summary
kluczowe dane według miesiąca, pochodzenia, typu urządzenia i kraja
origin_summary
lista wszystkich źródeł zawartych w zbiorze danych

metrics_summary

Tabela metrics_summary zawiera statystyki podsumowujące dotyczące każdego źródła i każdego miesięcznego zbioru danych:

yyyymm
Miesiąc okresu gromadzenia danych
origin
Adres URL pochodzenia witryny
rank
Przybliżony ranking popularności (na marzec 2021 r.)
[small|medium|large]_cls
ułamek ruchu według progów CLS
[fast|avg|slow]_<metric>
ułamek ruchu według progów skuteczności
p75_<metric>
Wartość 75. percentyla danych o skuteczności (milisekundy)
notification_permission_[accept|deny|ignore|dismiss]
ułamek przypadków, w których użytkownicy uzyskali zgodę na wyświetlanie powiadomień
[desktop|phone|tablet]Density
ułamek ruchu według formatu
[_4G|_3G|_2G|slow2G|offline]Density
Udział ruchu według typu połączenia
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
ułamek typów nawigacji

device_summary

Tabela device_summary zawiera zbiorcze statystyki według miesiąca, pochodzenia, kraju i urządzenia. Oprócz kolumn metrics_summary dostępne są:

device
Format urządzenia

country_summary

Tabela country_summary zawiera zbiorcze statystyki według miesiąca, pochodzenia, kraju i urządzenia. Oprócz kolumn metrics_summary dostępne są:

country_code
Dwuliterowy kod kraju
device
Format urządzenia

origin_summary

Tabela origin_summary zawiera listę wszystkich źródeł w zbiorze danych CrUX. Jest ona aktualizowana co miesiąc o najnowszą listę źródeł w zbiorze danych i zawiera jedną kolumnę: origin.

Eksperymentalny zbiór danych

Tabele w eksperymentalnym zbiorze danych są dokładnymi kopiami domyślnych tabel YYYYMM, ale korzystają z nowszych i bardziej zaawansowanych funkcji BigQuery, takich jak partycjonowanie i zagnieżdżanie, które umożliwiają tworzenie szybszych, prostszych i tańszych zapytań.

country

Zbiór danych experimental.country zawiera zagregowane dane ze zbiorów danych country_CC z dodatkową kolumną yyyymm z datą zbioru danych. Schemat jest identyczny jak w tabelach nieprzetworzonych, ale zawiera kolumny data i country_code, co umożliwia porównywanie danych na poziomie kraju w ciągu czasu bez złączania tabel miesięcznych.

global

Zbiór danych experimental.global zawiera dane zbiorcze ze zbioru danych all z dodatkową kolumną yyyymm dla daty zbioru danych. Schemat jest identyczny jak w tabelach surowych, ale zawiera datę, co umożliwia wykonywanie zapytań porównawczych w czasie bez złączania tabel miesięcznych.