Metodologia CrUX

Questa sezione documenta il modo in cui CrUX raccoglie e organizza i dati relativi all'esperienza utente.

Idoneità

Al centro del set di dati CrUX ci sono le esperienze utente individuali, che vengono aggregate in distribuzioni a livello di pagina e di origine. Questa sezione documenta l'idoneità degli utenti e i requisiti per le pagine e le origini da includere nel set di dati. Affinché un'esperienza venga inclusa nei dati a livello di pagina disponibili in PageSpeed Insights e nell'API CrUX, devono essere soddisfatti tutti i criteri di idoneità: Utente, Origine e Pagina. Le esperienze che soddisfano i criteri di utente e origine, ma non la pagina, non sono incluse nei dati a livello di origine disponibili in tutte le origini dati di CrUX.

Le pagine e le origini vengono incluse o rimosse automaticamente dal set di dati se la loro idoneità cambia nel tempo. Al momento non è possibile inviare manualmente pagine o origini da includere.

Individuabile pubblicamente

Una pagina deve essere individuabile pubblicamente per poter essere presa in considerazione per l'inclusione nel set di dati di CrUX.

Una pagina viene considerata rilevabile pubblicamente utilizzando gli stessi criteri di indicizzabilità dei motori di ricerca.

Una pagina non può soddisfare il requisito di rilevabilità se viene soddisfatta una qualsiasi delle seguenti condizioni, incluse le pagine root per il set di dati di origine:

  • La pagina viene pubblicata con un codice di stato HTTP diverso da 200 (dopo i reindirizzamenti).
  • La pagina viene pubblicata con un'intestazione HTTP X-Robots-Tag: noindex o equivalente.
  • Il documento include un meta tag <meta name="robots" content="noindex"> o un equivalente.

Visitate Google Search Console per avere una panoramica dello stato di indicizzazione del vostro sito.

Abbastanza popolare

Una pagina viene considerata sufficientemente popolare se ha un numero minimo di visitatori. Un'origine viene considerata sufficientemente popolare se ha un numero minimo di visitatori in tutte le sue pagine. Il numero esatto non viene divulgato, ma è stato scelto per garantire di avere campioni sufficienti per essere certi delle distribuzioni statistiche per le pagine incluse. Il numero minimo è lo stesso per pagine e origini.

Le pagine e le origini che non soddisfano la soglia di popolarità non sono incluse nel set di dati CrUX.

Origin

Un'origine rappresenta un intero sito web, raggiungibile da un URL come https://www.example.com. Affinché un'origine sia inclusa nel set di dati CrUX, deve soddisfare due requisiti:

  1. Rilevabile pubblicamente
  2. Abbastanza popolare

Puoi verificare che la tua origine sia rilevabile eseguendo un controllo di Lighthouse ed esaminando i risultati della categoria SEO. Il tuo sito non è rilevabile se la pagina principale non funziona se i controlli L'indicizzazione della pagina è bloccata o La pagina ha un codice di stato HTTP non riuscito.

Se un'origine viene determinata come rilevabile pubblicamente, le esperienze utente idonee su tutte le pagine di quell'origine vengono aggregate a livello di origine, indipendentemente dalla rilevabilità delle singole pagine. Tutte queste esperienze contano ai fini del requisito di popolarità dell'origine.

Ai fini delle query, tieni presente che tutte le origini nel set di dati CrUX sono minuscole.

Pagina

I requisiti per una pagina da includere nel set di dati CrUX sono gli stessi delle origini:

  1. Rilevabile pubblicamente
  2. Abbastanza popolare

Puoi verificare che una pagina sia rilevabile eseguendo un controllo di Lighthouse ed esaminando i risultati della categoria SEO. La pagina non è rilevabile se non supera i controlli L'indicizzazione della pagina è bloccata o La pagina ha un codice di stato HTTP non riuscito.

Generalmente le pagine hanno identificatori aggiuntivi nell'URL, inclusi parametri della stringa di query come ?utm_medium=email e frammenti come #main. Questi identificatori vengono rimossi dall'URL nel set di dati CrUX in modo che tutte le esperienze utente nella pagina vengano aggregate. Ciò è utile per le pagine che altrimenti non raggiungerebbero la soglia di popolarità in presenza di molte varianti di URL non congiunte per la stessa pagina. Tieni presente che, in rari casi, questo potrebbe raggruppare inaspettatamente le esperienze per pagine distinte, ad esempio se i parametri ?productID=101 e ?productID=102 rappresentano pagine diverse.

Le pagine in CrUX vengono misurate in base alla pagina di primo livello. Le pagine incluse come iframe non vengono indicate separatamente in CrUX, ma contribuiscono alle metriche della pagina di primo livello. Ad esempio, se https://www.example.com/page.html incorpora https://www.example.com/frame.html in un iframe, page.html verrà rappresentato in CrUX (in base agli altri criteri di idoneità), ma frame.html non lo farà. Se il valore CLS di frame.html è basso, il valore CLS verrà incluso nella misurazione del CLS per page.html. CrUX è il report Esperienza utente di Chrome e l'utente potrebbe non sapere che si tratta di un iframe. Pertanto, l'esperienza viene misurata nella pagina di primo livello, in base a come l'utente la vede.

L'architettura di un sito web può complicare il modo in cui i suoi dati vengono rappresentati in CrUX. Ad esempio, le app a pagina singola (APS) potrebbero utilizzare uno schema di transizione del percorso basato su JavaScript per spostarsi da una pagina all'altra, al contrario delle tradizionali navigazioni di pagine basate su anchor. Queste transizioni vengono mostrate all'utente come nuove visualizzazioni di pagina, ma a Chrome e alle API delle piattaforme sottostanti l'intera esperienza viene attribuita alla visualizzazione di pagina iniziale. Si tratta di una limitazione delle API della piattaforma web nativa su cui è realizzato CrUX. Per saperne di più, consulta In che modo le architetture SPA influiscono sui Segnali web essenziali su web.dev.

Utente

Affinché le sue esperienze siano aggregate nel set di dati CrUX, un utente deve soddisfare i seguenti criteri:

  1. Attiva i report di statistiche sull'utilizzo.
  2. Sincronizzare la cronologia del browser.
  3. Non deve essere impostata una passphrase di sincronizzazione.
  4. Utilizza una piattaforma supportata.

Le piattaforme attualmente supportate sono:

  • Versioni desktop di Chrome, inclusi i sistemi operativi Windows, MacOS, ChromeOS e Linux.
  • Versioni Android di Chrome, incluse le app native che utilizzano Schede personalizzate e WebAPKs.

Esistono alcune eccezioni degne di nota che non forniscono dati al set di dati CrUX:

  • Chrome su iOS.
  • App native per Android con WebView.
  • Altri browser Chromium (ad esempio Microsoft Edge).

Chrome non pubblica dati sulle percentuali di utenti che soddisfano questi criteri. Puoi scoprire di più sui dati che raccogliamo nel white paper sulla privacy di Chrome.

Pagine AMP (Accelerated Mobile Pages)

Le pagine create con AMP sono incluse nel set di dati di CrUX come qualsiasi altra pagina web. A partire dalla release di CrUX di giugno 2020, anche le pagine pubblicate tramite la cache AMP e / o visualizzate nel visualizzatore AMP vengono acquisite e attribuite all'URL della pagina del publisher.

Qualità dei dati

I dati in CrUX vengono sottoposti a una piccola quantità di elaborazione per garantire che siano statisticamente accurati, ben strutturati e di facile query.

Applicazione dei filtri

Il set di dati CrUX viene filtrato per garantire che i dati presentati siano statisticamente validi. Ciò potrebbe impedire la visualizzazione di intere pagine o origini nel set di dati.

Oltre ai criteri di idoneità applicati a origini e pagine, vengono applicati ulteriori filtri ai segmenti all'interno dei dati:

Le origini o le pagine con oltre il 20% del traffico totale escluso a causa di combinazioni di dimensioni non idonee vengono escluse completamente dal set di dati.

Poiché il set di dati a livello globale comprende le esperienze utente di tutti i paesi, le combinazioni di dimensioni che non soddisfano i criteri di popolarità a livello di paese possono comunque essere incluse a livello globale, a condizione che la popolarità sia sufficiente.

Fuzzing

Al set di dati viene applicata una piccola quantità di casualità per evitare il reverse engineering dei dati sensibili, ad esempio i volumi totali di traffico. Ciò non influisce sulla precisione delle statistiche aggregate.

Precisione

La maggior parte dei valori delle metriche all'interno del set di dati CrUX sono rappresentati come istogrammi di valori e dimensioni bin, dove il valore dell'istogramma è una frazione di tutti i segmenti inclusi che sommano a 1. Le dimensioni bin sono numeri in virgola mobile compresi tra 1,0 e 0,0001.

La larghezza del bin degli istogrammi è normalizzata per semplificare l'esecuzione di query e la visualizzazione dei dati. Ciò significa che i bin più grandi possono essere suddivisi in bin più piccoli, che condividono equamente la densità originale per mantenere coerenti la larghezza dei bin.

Licenza

I set di dati CrUX di Google sono concessi ai sensi di una licenza internazionale Creative Commons Attribution 4.0.