Rankgrootte toevoegen aan het Crux-rapport in BigQuery

Vanaf de dataset van februari 2021 voegen we een experimentele statistiek toe aan het CrUX-rapport in BigQuery , waarin de populariteit van origines wordt onderscheiden in ordes van grootte: de top 1k origins, top 10k, top 100k, top 1M, ...

Laten we eens kijken hoe dit er in de praktijk uitziet:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202102`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Rij rang_grootte aantal_oorsprongen
1 1.000 1.000
2 10.000 9.000
3 100.000 90.000
4 1.000.000 900.000
15 10.000.000 7.264.371

Voor de wereldwijde dataset van februari 2021 krijgen we 5 buckets. Zoals verwacht zien we in rij 1 dat er 1000 oorsprongen zijn met rangorde 1000 - de 1.000 meest populaire oorsprongen volgens onze metriek. Rij 2 ziet er misschien verrassend uit, wat aangeeft dat er slechts 9k-oorsprongen zijn in de top 10k-set; dit komt omdat de oorsprong in rij 1 ook deel uitmaakt van de top 10k-set. Om de top 10.000 oorsprongen te selecteren, moet men experimenteel.popularity.rank <= 10000 specificeren bij het opvragen.

De dataset bevat ook landspecifieke rangordegrootte. Deze zoekopdracht vermeldt bijvoorbeeld de 10k-oorsprongen die het populairst zijn in Duitsland.

SELECT DISTINCT origin
FROM `chrome-ux-report.country_de.202102`
WHERE experimental.popularity.rank <= 10000

Laten we, om het potentieel van onze nieuwe populariteitsmetriek aan te raken, eens kijken hoe populariteitssegmenten van het internet verschillen ten opzichte van de eerste contentful paint-metriek (FCP) . Voor deze zoekopdracht beschouwen we 1 seconde als een snelle gebruikerservaring.

SELECT
  SUM(fcp.density)/count(distinct origin)
FROM
  `chrome-ux-report.all.202102`,
  UNNEST(first_contentful_paint.histogram.bin) AS fcp
WHERE
  fcp.start < 1000 AND experimental.popularity.rank <= 1000

Voor de oorsprong met experimental.popularity.rank <= 1000 telt de query alle histogrambucketdichtheden op voor FCP-metrische waarden kleiner dan 1000 ms en deelt deze door het aantal oorsprongen. Dat wil zeggen dat de query het gemiddelde percentage snelle FCP-ladingen berekent voor de 1k meest populaire oorsprong. In deze vraag hebben alle oorsprongen evenveel gewicht, dus dit is misschien niet perfect. Maar laten we eens kijken of het resultaat gevoelig is voor het veranderen van de ranggrootte, door de Where-clausule te wijzigen om experimenteel.popularity.rank <= 10000 te specificeren. We doen dit voor 10k, 100k, enzovoort:

Rangschik de omvang van de oorsprong Percentage FCP < 1s, gemiddeld over de herkomst
1.000 53,6%
10.000 49,6%
100.000 45,9%
1.000.000 43,2%
10.000.000 39,9%

Dit geeft aan dat een snellere gebruikerservaring op internet verband houdt met populairder zijn.

In de dataset van oktober 2022 werd dit verder opgesplitst in stappen van een halve rang. Als u de eerste query voor deze gegevensset opnieuw uitvoert, worden de halve stappen en het aantal oorsprongen in elke ranggrootte weergegeven:

SELECT
  experimental.popularity.rank AS rank_magnitude,
  COUNT(DISTINCT origin) AS num_origins
FROM
  `chrome-ux-report.all.202210`
GROUP BY
  rank_magnitude
ORDER BY
  rank_magnitude
Rij rang_grootte aantal_oorsprongen
1 1.000 1.000
2 5.000 4.000
3 10.000 5.000
4 50.000 40.000
5 100.000 50.000
6 500.000 400.000
7 1.000.000 500.000
8 5.000.000 4.000.000
9 10.000.000 5.000.000
10 50.000.000 7.637.195

Lees meer over het gebruik van Crux op BigQuery en blader door het Crux-kookboek voor meer voorbeeldquery's. Deel uw vragen als u wilt en laat ons weten wat u vindt.