CrUX-methodiek

In dit gedeelte wordt beschreven hoe CruX gegevens over de gebruikerservaring verzamelt en organiseert.

Geschiktheid

De kern van de CrUX-dataset wordt gevormd door individuele gebruikerservaringen, die worden samengevoegd tot distributies op pagina- en oorsprongniveau. In dit gedeelte worden de criteria voor gebruikers en de vereisten voor pagina's en oorsprongen beschreven om in de dataset te worden opgenomen. Aan alle criteria moet worden voldaan om een ​​ervaring te kunnen opnemen in de gegevens op paginaniveau die beschikbaar zijn in PageSpeed ​​Insights en de CrUX API: Gebruiker , Oorsprong en Pagina . Ervaringen die voldoen aan de criteria Gebruiker en Oorsprong, maar niet aan Pagina, worden niet opgenomen in de gegevens op oorsprongniveau die beschikbaar zijn in alle CrUX-gegevensbronnen.

Pagina's en bronnen worden automatisch aan de dataset toegevoegd of eruit verwijderd als hun geschiktheid in de loop van de tijd verandert. Op dit moment is het niet mogelijk om handmatig pagina's of bronnen ter opname aan te bieden.

Openbaar vindbaar

Een pagina moet openbaar vindbaar zijn om in aanmerking te komen voor opname in de CruX-dataset.

Een pagina wordt als publiekelijk vindbaar beschouwd op basis van dezelfde indexeerbaarheidscriteria als zoekmachines.

Een pagina voldoet niet aan de vindbaarheidseis als aan een van de volgende voorwaarden wordt voldaan, inclusief de hoofdpagina's van de oorspronkelijke dataset:

  • De pagina wordt weergegeven met een HTTP- statuscode die afwijkt van 200 (na omleidingen).
  • De pagina wordt weergegeven met een HTTP X-Robots-Tag: noindex header of een equivalent daarvan.
  • Het document bevat een <meta name="robots" content="noindex"> meta-tag of een equivalent daarvan.

Raadpleeg Google Search Console voor een overzicht van de indexeringsstatus van uw website.

Voldoende populair

Een pagina wordt als voldoende populair beschouwd als deze een minimum aantal bezoekers heeft. Een website wordt als voldoende populair beschouwd als deze een minimum aantal bezoekers heeft op al zijn pagina's. Het exacte aantal wordt niet bekendgemaakt, maar is gekozen om ervoor te zorgen dat we voldoende gegevens hebben om de statistische verdeling van de opgenomen pagina's te kunnen beoordelen. Het minimum aantal is hetzelfde voor pagina's en websites.

Pagina's en oorsprongen die niet aan de populariteitsdrempel voldoen, worden niet opgenomen in de CruX-dataset.

Oorsprong

Een origin vertegenwoordigt een complete website, bereikbaar via een URL zoals https://www.example.com . Om in de CruX-dataset te worden opgenomen, moet een origin aan twee vereisten voldoen:

  1. Openbaar vindbaar
  2. Voldoende populair

Je kunt controleren of je website vindbaar is door een Lighthouse-audit uit te voeren en de resultaten van de SEO-categorie te bekijken. Je site is niet vindbaar als je hoofdpagina niet slaagt voor de audits met de statuscode ' Pagina is geblokkeerd voor indexering' of 'Pagina heeft een onsuccesvolle HTTP-statuscode' .

Als een website als publiek vindbaar wordt beschouwd, worden alle relevante gebruikerservaringen op alle pagina's van die website samengevoegd op websiteniveau, ongeacht de vindbaarheid van de individuele pagina's. Al deze ervaringen tellen mee voor de populariteitseis van de website.

Voor zoekopdrachten dient u er rekening mee te houden dat alle oorsprongen in de CruX-dataset in kleine letters zijn weergegeven.

Pagina

De vereisten voor een pagina om in de CruX-dataset te worden opgenomen, zijn dezelfde als voor origins:

  1. Openbaar vindbaar
  2. Voldoende populair

Je kunt controleren of een pagina vindbaar is door een Lighthouse-audit uit te voeren en de resultaten van de SEO-categorie te bekijken. Je pagina is niet vindbaar als deze niet slaagt voor de audits ' Pagina is geblokkeerd voor indexering' of 'Pagina heeft een onsuccesvolle HTTP-statuscode' .

Als een pagina voor sommige gebruikers publiekelijk vindbaar is, maar onder bepaalde omstandigheden een HTTP-statuscode 'niet succesvol' retourneert, dan worden die ervaringen niet in CruX opgenomen.

Pagina's bevatten vaak extra identificatoren in hun URL, zoals queryparameters als ?utm_medium=email en fragmenten als #main . Deze identificatoren worden in de CruX-dataset uit de URL verwijderd, zodat alle gebruikerservaringen op de pagina worden samengevoegd. Dit is handig voor pagina's die anders niet aan de populariteitsdrempel zouden voldoen als er veel verschillende URL-varianten voor dezelfde pagina zouden bestaan. Houd er rekening mee dat dit in zeldzame gevallen onverwacht kan leiden tot het groeperen van ervaringen voor verschillende pagina's; bijvoorbeeld als de parameters ?productID=101 en ?productID=102 verschillende pagina's vertegenwoordigen.

Pagina's in CrUX worden gemeten op basis van de pagina op het hoogste niveau. Pagina's die als iframe zijn opgenomen, worden niet afzonderlijk gerapporteerd in CrUX, maar dragen wel bij aan de statistieken van de pagina op het hoogste niveau. Als bijvoorbeeld https://www.example.com/page.html https://www.example.com/frame.html in een iframe insluit, dan wordt page.html wel weergegeven in CrUX (mits aan de overige criteria wordt voldaan), maar frame.html niet . En als frame.html een lage CLS heeft, wordt de CLS meegenomen in de meting van de CLS voor page.html . CrUX is het Chrome- gebruikerservaringrapport en een gebruiker is zich er mogelijk niet eens van bewust dat het een iframe betreft. Daarom wordt de ervaring gemeten op het hoogste niveau – zoals de gebruiker die ziet.

De architectuur van een website kan de weergave van de gegevens in CrUX complexer maken. Single-page applicaties (SPA's) gebruiken bijvoorbeeld vaak een op JavaScript gebaseerd routeschema om tussen pagina's te navigeren, in plaats van de gebruikelijke ankergebaseerde paginanavigatie. Deze overgangen lijken voor de gebruiker nieuwe paginaweergaven, maar voor Chrome en de onderliggende platform-API's wordt de volledige ervaring toegeschreven aan de initiële paginaweergave. Dit is een beperking van de webplatform-API's waarop CrUX is gebouwd. Zie ' How SPA architectures affect Core Web Vitals' op web.dev voor meer informatie.

Gebruiker

Om de ervaringen van een gebruiker in de CruX-dataset te laten opnemen, moet die gebruiker aan de volgende criteria voldoen:

  1. Schakel rapportage van gebruiksstatistieken in.
  2. Synchroniseer hun browsergeschiedenis .
  3. Er is geen synchronisatiewachtwoord ingesteld.
  4. Gebruik een ondersteund platform.

De momenteel ondersteunde platforms zijn:

  • Desktopversies van Chrome, waaronder die voor Windows, macOS, ChromeOS en Linux.
  • Android-versies van Chrome, inclusief mobiele apps die gebruikmaken van aangepaste tabbladen en WebAPK's .

Er zijn een paar opvallende uitzonderingen die geen gegevens aan de CruX-dataset leveren:

  • Chrome op iOS.
  • Android-apps die WebView gebruiken.
  • Andere Chromium-browsers (bijvoorbeeld Microsoft Edge ).

Chrome publiceert geen gegevens over het percentage gebruikers dat aan deze criteria voldoet. U kunt meer lezen over de gegevens die we verzamelen in de Chrome-documentatie .

Accelerated Mobile Pages (AMP)

Pagina's die met AMP zijn gemaakt, worden net als alle andere webpagina's opgenomen in de CrUX-dataset. Sinds de release van CrUX in juni 2020 worden ook pagina's die via de AMP-cache worden aangeboden en/of in de AMP-viewer worden weergegeven, vastgelegd en gekoppeld aan de URL van de pagina van de uitgever.

Gegevenskwaliteit

De gegevens in CruX ondergaan een kleine hoeveelheid verwerking om ervoor te zorgen dat ze statistisch nauwkeurig, goed gestructureerd en gemakkelijker te doorzoeken zijn.

Filteren

De CrUX-dataset wordt gefilterd om ervoor te zorgen dat de gepresenteerde gegevens statistisch valide zijn. Dit kan ertoe leiden dat complete pagina's of bronnen niet in de dataset worden opgenomen.

Naast de selectiecriteria die gelden voor herkomst en pagina's, wordt er verder gefilterd op segmenten binnen de data:

Bronnen of pagina's waarvan meer dan 20% van het totale verkeer is uitgesloten vanwege niet-toegestane combinaties van dimensies, worden volledig uit de dataset verwijderd.

Omdat de dataset op wereldniveau gebruikerservaringen uit alle landen omvat, kunnen combinaties van dimensies die niet voldoen aan de populariteitscriteria op landniveau toch op wereldniveau worden opgenomen, mits er voldoende populariteit is.

Vervaging

Er wordt een kleine hoeveelheid willekeurigheid aan de dataset toegevoegd om te voorkomen dat gevoelige gegevens, zoals totale verkeersvolumes, via reverse engineering kunnen worden achterhaald. Dit heeft geen invloed op de nauwkeurigheid van de geaggregeerde statistieken.

Precisie

De meeste metrische waarden in de CruX-dataset worden weergegeven als histogrammen van waarden en bin-groottes, waarbij de histogramwaarde een fractie is van alle opgenomen segmenten die samen 1 vormen. Bin-groottes zijn drijvende-komma getallen tussen 1,0 en 0,0001.

De breedte van de histogramvakken wordt genormaliseerd om het opvragen en visualiseren van de gegevens te vereenvoudigen. Dit betekent dat grotere vakken kunnen worden opgesplitst in kleinere vakken, die de oorspronkelijke dichtheid gelijkmatig delen om consistente vakbreedtes te behouden.

Licentie

De CrUX-datasets van Google zijn gelicentieerd onder een Creative Commons Attribution 4.0 International License .