Dodanie wartości rankingu do raportu na temat użytkowania Chrome w BigQuery

Począwszy od zbioru danych z lutego 2021 r. do raportu na temat użytkowania Chrome w BigQuery dodaliśmy dane eksperymentalne, które pozwalają rozróżnić popularność źródeł według rzędu wielkości: 1 tys. najlepszych źródeł, najlepsze 10 tys., najlepsze 100 tys., najlepsze 1 mln najlepszych źródeł...

Zobaczmy, jak to wygląda w praktyce:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 10 000 9 000
3 100 000 90 000
4 1 000 000 900 000
15 10 000 000 7 264 371

W przypadku globalnego zbioru danych z lutego 2021 r. uzyskujemy 5 zasobników. Zgodnie z oczekiwaniami w wierszu 1 widzimy, że istnieje 1000 źródeł o rangi 1000, a 1000 na podstawie naszych danych. Wiersz 2 może wyglądać zaskakująco, co wskazuje, że znajdują się tylko 9 tys. źródeł w pierwszych 10 tysięcy; to dlatego, że źródła w wierszu 1 są należą też do najlepszych 10 tysięcy osób. Aby wybrać 10 tys. najlepszych źródeł, musisz: w zapytaniu określa wartość eksperymentalny.popularity.rank <= 10000.

Zbiór danych zawiera też rangę w poszczególnych krajach. Na przykład to zawiera listę 10 tysięcy najpopularniejszych źródeł w Niemczech.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Aby wspomnieć o potencjale naszego nowego wskaźnika popularności, zobaczmy, jak popularność segmenty internetu różnią się pod względem danych dotyczących pierwszego wyrenderowania treści (FCP). Na potrzeby tego zapytania uważamy, że 1 sekunda to szybkie miejsce dla użytkownika.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

W przypadku źródeł z experimental.popularity.rank <= 1000 zapytanie sumuje wszystkie Gęstości zasobników histogramu dla wartości wskaźnika FCP mniejszych niż 1000 ms i dzielenia przez liczbę źródeł, czyli średni procent szybkie ładowanie FCP dla 1000 najpopularniejszych źródeł. W tym zapytaniu wszystkie źródła mają taka sama waga, więc prawdopodobnie nie jest to idealne rozwiązanie. Zobaczmy jednak, czy wynik wyczuwa na zmianę wielkości rankingu przez zmianę klauzuli gdzie na należy określić eksperymentalny.popularity.rank <= 10000. Robimy to dla 10 000, 100 000 itd. dnia:

Kolejność źródeł Procent FCP < 1 s, uśrednione wg źródeł
1000 53,6%
10 000 49,6%
100 000 45,9%
1 000 000 43,2%
10 000 000 39,9%

Oznacza to, że szybsze korzystanie z internetu wiąże się z większą popularnością.

W zbiorze danych z października 2022 r. dane zostały dodatkowo podzielone na etapy o połowie rankingu. Ponowne uruchomienie pierwszego zapytania dla tego zbioru danych pokazuje etapy i liczbę źródeł w poszczególnych poziomach pozycji:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Wiersz rank_magnitude num_origins
1 1000 1000
2 5000 4000
3 10 000 5000
4 50 000 40 000
5 100 000 50 000
6 500 000 400 000
7 1 000 000 500 000
8 5 000 000 4 000 000
9 10 000 000 5 000 000
10 50 000 000 7 637 195

Dowiedz się więcej o korzystaniu z raportu CrUX w BigQuery i przejrzyj poradnik CrUX, aby zobaczyć więcej przykładowych zapytań. Jeśli chcesz, prześlij nam swoje zapytania i daj nam znać, co udało Ci się znaleźć.