Supporto dei valori in virgola mobile a 16 bit in WGSL
In WGSL, il tipo f16
è l'insieme di valori in virgola mobile a 16 bit del formato binary16 (precisione dimezzata) IEEE-754. Ciò significa che utilizza 16 bit per rappresentare un numero in virgola mobile, rispetto ai 32 bit per i numeri in virgola mobile convenzionali a precisione singola (f32
). Questa dimensione inferiore può portare a miglioramenti significativi delle prestazioni, in particolare durante l'elaborazione di grandi quantità di dati.
Per fare un confronto, su un dispositivo Apple M1 Pro, l'implementazione f16
dei modelli Llama2 7B utilizzati nella demo di chat WebLLM è notevolmente più veloce dell'implementazione f32
, con un miglioramento del 28% della velocità di precompilazione e del 41% della velocità di decodifica, come mostrato negli screenshot seguenti.
Non tutte le GPU supportano valori in virgola mobile a 16 bit. Quando la funzionalità "shader-f16"
è disponibile in un GPUAdapter
, ora puoi richiedere un GPUDevice
con questa funzionalità e creare un modulo shader WGSL che sfrutta il tipo a virgola mobile a metà precisione f16
. Questo tipo può essere utilizzato nel modulo Shar WGSL solo se abiliti l'estensione WGSL f16
con enable f16;
. In caso contrario, createShaderModule() genererà un errore di convalida. Vedi il seguente esempio minimo e il problema issue dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
È possibile supportare sia i tipi f16
che f32
nel codice del modulo shader WGSL con un alias
a seconda del supporto della funzionalità "shader-f16"
, come mostrato nello snippet seguente.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Spingere i limiti
Per impostazione predefinita, il numero massimo di byte necessari per contenere un campione (pixel o sottopixel) di dati di output della pipeline di rendering in tutti i collegamenti di colori è 32 byte. Ora è possibile effettuare richieste fino a 64 utilizzando il limite di maxColorAttachmentBytesPerSample
. Vedi l'esempio seguente e issue dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
I limiti di maxInterStageShaderVariables
e maxInterStageShaderComponents
utilizzati per le comunicazioni tra le fasi sono stati aumentati su tutte le piattaforme. Per i dettagli, consulta issue dawn:1448.
Per ogni fase dello shader, il numero massimo di voci di layout del gruppo di binding in un layout della pipeline che sono buffer di archiviazione è 8 per impostazione predefinita. Ora è possibile richiederne fino a 10 utilizzando il limite di maxStorageBuffersPerShaderStage
. Vedi issue dawn:2159.
È stato aggiunto un nuovo limite per maxBindGroupsPlusVertexBuffers
. Consiste nel numero massimo di slot di gruppi di binding e buffer di vertici utilizzati contemporaneamente, contando gli slot vuoti sotto l'indice più alto. Il valore predefinito è 24. Vedi issue dawn:1849.
Modifiche allo stato della maschera di profondità
Per migliorare l'esperienza degli sviluppatori, gli attributi stato profondità depthWriteEnabled
e depthCompare
non sono sempre più obbligatori: il valore depthWriteEnabled
è obbligatorio solo per i formati con profondità, mentre depthCompare
non lo è per i formati con profondità se non vengono utilizzati affatto. Vedi issue dawn:2132.
Aggiornamenti delle informazioni sugli adattatori
Gli attributi delle informazioni sull'adattatore type
e backend
non standard sono ora disponibili quando viene chiamata la funzione requestAdapterInfo() se l'utente ha attivato il flag "Funzionalità per sviluppatori WebGPU" in chrome://flags/#enable-webgpu-developer-features
. type
può essere "GPU discreta", "GPU integrata", "CPU" o "sconosciuto". backend
può essere "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" o "null". Consulta issue dawn:2112 e issue dawn:2107.
Il parametro facoltativo dell'elenco unmaskHints
in requestAdapterInfo() è stato rimosso. Vedi issue dawn:1427.
quantizzazione delle query con timestamp
Le query con timestamp consentono alle applicazioni di misurare il tempo di esecuzione dei comandi GPU con una precisione in nanosecondi. Tuttavia, la specifica WebGPU rende facoltative le query relative ai timestamp a causa di problemi di attacco di temporizzazione. Il team di Chrome ritiene che la quantizzazione delle query sui timestamp offra un buon compromesso tra precisione e sicurezza, riducendo la risoluzione a 100 microsecondi. Vedi issue dawn:1800.
In Chrome, gli utenti possono disattivare la quantizzazione del timestamp attivando il flag "Funzionalità per sviluppatori WebGPU" in chrome://flags/#enable-webgpu-developer-features
. Tieni presente che questo flag da solo non attiva la funzionalità "timestamp-query"
. La sua implementazione è ancora sperimentale e richiede il flag "Supporto WebGPU non sicuro" in chrome://flags/#enable-unsafe-webgpu
.
In Dawn è stato aggiunto un nuovo pulsante di attivazione/disattivazione del dispositivo denominato "timestamp_quantization", che è abilitato per impostazione predefinita. Il seguente snippet mostra come consentire la funzionalità sperimentale "timestamp-query" senza quantizzazione del timestamp quando richiedi un dispositivo.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Funzionalità per le pulizie di primavera
La funzionalità sperimentale "timestamp-query-inside-passes" è stata rinominata in "chromium-experimental-timestamp-query-inside-passes" per chiarire agli sviluppatori che questa funzionalità è sperimentale e al momento disponibile solo nei browser basati su Chromium. Vedi issue dawn:1193.
La funzionalità sperimentale "pipeline-statistics-query", che è stata implementata solo parzialmente, è stata rimossa perché non è più in fase di sviluppo. Vedi issue chromium:1177506.
Sono riportati solo alcuni punti salienti. Consulta l'elenco completo dei commit.
Novità di WebGPU
Un elenco di tutto ciò che è stato trattato nella serie Novità di WebGPU.
Chrome 131
- Tagliare le distanze in WGSL
- GPUCanvasContext getConfiguration()
- Gli elementi primitivi punto e linea non devono avere bias di profondità
- Funzioni integrate di scansione inclusiva per i sottogruppi
- Supporto sperimentale per il disegno indiretto multiplo
- Opzione di compilazione del modulo shader matematica rigorosa
- Rimuovi requestAdapterInfo() di GPUAdapter
- Aggiornamenti di Dawn
Chrome 130
- Combinazione di due sorgenti
- Miglioramenti ai tempi di compilazione degli shader su Metal
- Ritiro di GPUAdapter requestAdapterInfo()
- Aggiornamenti di Dawn
Chrome 129
- Supporto HDR con modalità di mappatura tonale della tela
- Supporto dei sottogruppi ampliato
- Aggiornamenti di Dawn
Chrome 128
- Sperimentazione con i sottogruppi
- Ritiro dell'impostazione della bias di profondità per linee e punti
- Nascondere l'avviso DevTools relativo a un errore non rilevato se preventDefault
- WGSL esegue prima l'interpolazione del campionamento e poi
- Aggiornamenti sull'alba
Chrome 127
- Supporto sperimentale per OpenGL ES su Android
- Attributo info di GPUAdapter
- Miglioramenti all'interoperabilità di WebAssembly
- Errori dell'encoder dei comandi migliorati
- Aggiornamenti sull'alba
Chrome 126
- Aumentare il limite di maxTextureArrayLayers
- Ottimizzazione del caricamento del buffer per il backend Vulkan
- Miglioramenti ai tempi di compilazione degli shader
- Gli spazi dei comandi inviati devono essere univoci
- Aggiornamenti di Dawn
Chrome 125
- Sottogruppi (funzionalità in fase di sviluppo)
- Eseguire il rendering di una sezione della texture 3D
- Aggiornamenti sull'alba
Chrome 124
- Texture di archiviazione di sola lettura e lettura/scrittura
- Supporto di worker di servizio e worker condivisi
- Nuovi attributi delle informazioni sull'adattatore
- Correzioni di bug
- Aggiornamenti di Dawn
Chrome 123
- Supporto delle funzioni integrate DP4a in WGSL
- Parametri del cursore non soggetti a limitazioni in WGSL
- Sintassi alternativa per il dereferenziamento dei compositi in WGSL
- Separa lo stato di sola lettura per gli aspetti relativi allo stencil e alla profondità
- Aggiornamenti di Dawn
Chrome 122
- Ampliare la copertura con la modalità di compatibilità (funzionalità in fase di sviluppo)
- Aumentare il limite di maxVertexAttributes
- Aggiornamenti di Dawn
Chrome 121
- Supporto di WebGPU su Android
- Utilizzare DXC anziché FXC per la compilazione degli shader su Windows
- Query sui timestamp nei passaggi di calcolo e rendering
- Punti di contatto predefiniti per i moduli shader
- Supporto di display-p3 come spazio colore GPUExternalTexture
- Informazioni sugli heap di memoria
- Aggiornamenti sull'alba
Chrome 120
- Supporto dei valori in virgola mobile a 16 bit in WGSL
- Supera i limiti
- Modifiche allo stato della maschera di profondità
- Aggiornamenti delle informazioni sugli adattatori
- Quantizzazione delle query sui timestamp
- Funzionalità per le pulizie di primavera
Chrome 119
- Texture con formato a virgola mobile 32 bit filtrabili
- Formato vertice unorm10-10-10-2
- Formato texture rgb10a2uint
- Aggiornamenti di Dawn
Chrome 118
- Supporto di HTMLImageElement e ImageData in
copyExternalImageToTexture()
- Supporto sperimentale per le texture di archiviazione in lettura/scrittura e di sola lettura
- Aggiornamenti sull'alba
Chrome 117
- Annulla impostazione vertex buffer
- Reimpostare il gruppo di associazione
- Silenzia gli errori derivanti dalla creazione di pipeline asincrone in caso di smarrimento del dispositivo
- Aggiornamenti sulla creazione di moduli shader SPIR-V
- Miglioramento dell'esperienza degli sviluppatori
- Pipeline di memorizzazione nella cache con layout generato automaticamente
- Aggiornamenti di Dawn
Chrome 116
- Integrazione di WebCodecs
- Dispositivo smarrito restituito da GPUAdapter
requestDevice()
- Mantenere la riproduzione video fluida se viene chiamato
importExternalTexture()
- Conformità delle specifiche
- Miglioramento dell'esperienza degli sviluppatori
- Aggiornamenti di Dawn
Chrome 115
- Estensioni di lingua WGSL supportate
- Supporto sperimentale per Direct3D 11
- Ottenere una GPU discreta per impostazione predefinita con alimentazione CA
- Miglioramento dell'esperienza degli sviluppatori
- Aggiornamenti di Dawn
Chrome 114
- Ottimizzare JavaScript
- getCurrentTexture() su canvas non configurato genera un errore InvalidStateError
- Aggiornamenti di WGSL
- Aggiornamenti sull'alba