Dodanie wartości rankingu do raportu na temat użytkowania Chrome w BigQuery

Zaczynając od zbioru danych z lutego 2021 r., dodajemy do raportu CRUX w BigQuery dane eksperymentalne, które rozróżniają popularność źródeł pod względem wielkości: 1000 najpopularniejszych źródeł, 10 tys. najpopularniejszych źródeł, 100 tys. najpopularniejszych źródeł, …

Zobaczmy, jak to wygląda w praktyce:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 10 000 9000
3 100 000 90 000
4 1 000 000 900 000
15 10 000 000 7 264 371

W przypadku globalnego zbioru danych z lutego 2021 r. mamy 5 grup. Zgodnie z oczekiwaniami w wierszu 1 widzimy, że jest 1000 punktów docelowych o wielkości 1000 – czyli 1000 najpopularniejszych punktów docelowych według naszych danych. Wiersz 2 może być zaskakujący, ponieważ wskazuje, że w zbiorze 10 000 najlepszych źródeł jest tylko 9 tys. źródeł. Dzieje się tak, ponieważ źródła w wierszu 1 również należą do zbioru 10 000 najlepszych źródeł. Aby wybrać 10 tys. najpopularniejszych źródeł, w zapytaniach musisz określić parametr Experiment.popularity.rank <= 10000.

Zbiór danych zawiera też wielkość rankingu w poszczególnych krajach. Na przykład to zapytanie zawiera listę 10 tysięcy miejsc pochodzenia, które są najpopularniejsze w Niemczech.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Aby pokazać potencjał naszego nowego wskaźnika popularności, przyjrzyjmy się, jak różnią się segmenty popularności w internecie pod względem wskaźnika pierwszego wyrenderowania treści (FCP). Na potrzeby tego zapytania 1 sekundę uznajemy za szybkie działanie.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

W przypadku źródeł z wartością experimental.popularity.rank <= 1000 zapytanie sumuje wszystkie gęstości zasobników hisogramu dla wartości danych FCP mniejszych niż 1000 ms i podziela ją przez liczbę źródeł, czyli oblicza średni procent szybkiego wczytywania FCP dla 1 tys. najpopularniejszych źródeł. W tym zapytaniu wszystkie źródła mają równą wagę, więc nie jest to idealne rozwiązanie. Sprawdźmy jednak, czy wynik jest wrażliwy na zmianę wielkości rankingu. Aby to zrobić, zmień klauzulę where, aby określić experimental.popularity.rank <= 10000. Robimy to w przypadku 10 tys., 100 tys. i tak dalej:

Wielkość rankingu źródeł Odsetek FCP < 1, uśredniony według źródeł
1000 53,6%
10 000 49,6%
100 000 45,9%
1 000 000 43,2%
10 000 000 39,9%

Oznacza to, że szybsze działanie stron internetowych wiąże się z większą popularnością.

W zbiorze danych z października 2022 r. dane zostały dodatkowo podzielone na etapy o połowie rankingu. Ponowne uruchomienie pierwszego zapytania dotyczącego tego zbioru danych pokazuje półkroki i liczbę źródeł w każdej wielkości rangi:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 5000 4000
3 10 000 5000
4 50 000 40 000
5 100 000 50 000
6 500 000 400 000
7 1 000 000 500 000
8 5 000 000 4 000 000
9 10 000 000 5 000 000
10 50 000 000 7,637,195

Dowiedz się więcej o używaniu CrUX w BigQuery i zapoznaj się z Poradnikiem dotyczącym CrUX, aby zobaczyć więcej przykładowych zapytań. Jeśli chcesz, możesz udostępnić nam swoje zapytania i poinformować nas o wynikach.