Esperimenti con i sottogruppi
La funzionalità dei sottogruppi abilita il parallelismo a livello di SIMD, consentendo ai thread all'interno di un gruppo di comunicare ed eseguire operazioni matematiche collettive (ad esempio il calcolo della somma di 16 numeri). Ciò fornisce una forma molto efficiente di condivisione dei dati tra thread.
È disponibile un'implementazione minima della proposta di sottogruppi per i test locali dietro il "Supporto WebGPU non sicuro" per chrome://flags/#enable-unsafe-webgpu
.
Puoi anche provare sottogruppi sul tuo sito con utenti reali registrandoti alla prova dell'origine. Leggi la guida introduttiva alle prove dell'origine per istruzioni su come preparare il tuo sito all'utilizzo delle prove dell'origine. La prova dell'origine verrà eseguita dalla versione 128 alla versione 131 di Chrome (fino al 19 febbraio 2025). Vedi Intenzione di sperimentare.
Quando la funzionalità "subgroups"
è disponibile in un GPUAdapter
, richiedi un GPUDevice
con questa funzionalità per ricevere assistenza per i sottogruppi in WGSL e controlla i relativi limiti di minSubgroupSize
e maxSubgroupSize
.
Devi inoltre abilitare esplicitamente questa estensione nel codice WGSL con enable subgroups;
. Quando l'opzione è attiva, puoi accedere alle seguenti aggiunte:
subgroup_invocation_id
: un valore integrato per l'indice del thread all'interno del sottogruppo.subgroup_size
: un valore integrato per l'accesso alle dimensioni del sottogruppo.subgroupBallot(value)
: restituisce un insieme di campi di bit in cui il bit corrispondente asubgroup_invocation_id
è 1 sevalue
è vero per quella chiamata attiva e 0 negli altri casi.subgroupBroadcast(value, id)
: trasmette il valorevalue
dalla chiamata consubgroup_invocation_id
corrispondente aid
a tutte le chiamate all'interno del sottogruppo. Nota:id
deve essere una costante di compilazione.
In futuro verranno aggiunte altre funzioni integrate come subgroupAdd
, subgroupAll
, subgroupElect
e subgroupShuffle
. Vedi il problema 354738715.
Per consentire f16 nelle operazioni nei sottogruppi, richiedi un GPUDevice
con le funzionalità "subgroups"
, "subgroups-f16"
e "shader-f16"
, quindi abilitalo nel codice WGSL con enable f16, subgroups, subgroups_f16;
.
Il seguente snippet di codice fornisce una base con cui sperimentare e scoprire il potenziale dei sottogruppi.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Ritira l'impostazione della bias di profondità per linee e punti
Una modifica alle specifiche WebGPU rende un errore di convalida l'impostazione di depthBias
, depthBiasSlopeScale
e depthBiasClamp
su un valore diverso da zero quando la topologia per una pipeline di rendering è di tipo linea o punto. Per concedere agli sviluppatori tempo sufficiente per aggiornare il codice, nella console DevTools viene mostrato un avviso relativo a questa convalida imminente, in cui i valori vengono anche forzati su 0. Vedi il problema 352567424.
Nascondi avviso di errore non acquisito se preventDefault.
Nella console DevTools, gli avvisi per gli eventi uncapturederror
non vengono più visualizzati se è stato registrato un listener di eventi per uncapturederror
e il metodo preventDefault()
evento è stato chiamato all'interno del callback del listener di eventi. Questo comportamento corrisponde alla gestione degli eventi in JavaScript. Vedi l'esempio e il problema 40263619 che seguono.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL interpola prima il campionamento e poi
L'attributo interpolate
WGSL ti consente di gestire l'interpolazione dei dati I/O definita dall'utente. Ora i nuovi parametri di campionamento dell'interpolazione first
(predefinito) e either
offrono un controllo aggiuntivo: first
utilizza il valore del primo vertice della primitiva, mentre either
consente il primo o l'ultimo vertice. Vedi il problema 340278447.
Aggiornamenti all'alba
L'implementazione di WGPUFuture di Dawn per gestire le operazioni asincrone è ora completata. I concetti chiave includono wgpuInstanceProcessEvents per l'elaborazione opportunistica degli eventi e WGPUCallbackMode per la definizione delle località di callback. WGPUFuture indica eventi occasionali con una durata infinita, mentre wgpuInstanceWaitAny è in attesa del completamento di qualsiasi evento futuro o di un timeout. Vedi il problema 42240932.
Surface::GetCapabilities()
ora non riporta il valore CompositeAlphaMode::Auto
. È ancora valido ed equivale a Surface::GetCapabilities().alphaMode[0]
. Vedi il problema 292.
Il backend OpenGL ora supporta Surface
con un blit y-flip per ogni chiamata Present()
. Vedi il problema 344814083.
Il metodo Adapter::GetProperties()
è stato ritirato e sostituito con Adapter::GetInfo()
.
Jaswant, un collaboratore esterno, ha riscritto tutti i file CMake, semplificando l'aggiornamento e consentendo la precompilazione. Consulta la guida rapida per l'utilizzo dei progetti Dawn in CMake.
Descrive solo alcuni dei punti salienti. Consulta l'elenco completo dei commit.
Novità di WebGPU
Un elenco di tutti gli argomenti trattati nella serie Novità di WebGPU.
Chrome 128
- Esperimenti con i sottogruppi
- Ritirare l'impostazione della bias di profondità per linee e punti
- Nascondi avviso di errore non acquisito se preventDefault
- WGSL interpola prima il campionamento e
- Aggiornamenti sull'alba
Chrome 127
- Supporto sperimentale per OpenGL ES su Android
- Attributo informazioni GPUAdapter
- Miglioramenti all'interoperabilità di WebAssembly
- Miglioramento degli errori del codificatore di comandi
- Aggiornamenti sull'alba
Chrome 126
- Aumenta il limite di maxTextureArray riuscita
- Ottimizzazione del caricamento del buffer per il backend Vulkan
- Miglioramenti del tempo di compilazione degli Shader
- I buffer dei comandi inviati devono essere univoci
- Aggiornamenti sull'alba
Chrome 125
- Sottogruppi (funzionalità in fase di sviluppo)
- Esegui il rendering su una porzione della texture 3D
- Aggiornamenti sull'alba
Chrome 124
- Texture di archiviazione di sola lettura e lettura/scrittura
- Assistenza per lavoratori dei servizi e lavoratori condivisi
- Nuovi attributi relativi alle informazioni sull'adattatore
- Correzioni di bug
- Aggiornamenti sull'alba
Chrome 123
- Supporto delle funzioni integrate DP4a in WGSL
- Parametri di puntatore senza limitazioni in WGSL
- Sintassi dello zucchero per il deriferimento dei composti in WGSL
- Separa lo stato di sola lettura per gli aspetti relativi allo stencil e alla profondità
- Aggiornamenti sull'alba
Chrome 122
- Ampliare la copertura con la modalità di compatibilità (funzionalità in fase di sviluppo)
- Aumenta il limite maxVertexAttributes
- Aggiornamenti sull'alba
Chrome 121
- Supporta WebGPU su Android
- Usa DXC al posto di FXC per la compilazione dello shaker su Windows
- Query con timestamp nei passaggi di computing e rendering
- Punti di ingresso predefiniti ai moduli Shar
- Supporta display-p3 come spazio colore GPUExternalTexture
- Informazioni sugli heap di memoria
- Aggiornamenti sull'alba
Chrome 120
- Supporto per valori con virgola mobile a 16 bit in WGSL
- Supera i limiti
- Modifiche allo stato Profondità dello stencil
- Aggiornamenti delle informazioni sull'adattatore
- Quantizzazione delle query con timestamp
- Funzionalità per le pulizie di primavera
Chrome 119
- Trame in virgola mobile a 32 bit filtrabili
- formato vertex unorm10-10-10-2
- Formato texture RGB 10a2uint
- Aggiornamenti sull'alba
Chrome 118
- Supporto di HTMLImageElement e ImageData in
copyExternalImageToTexture()
- Supporto sperimentale per la texture di archiviazione in lettura/scrittura e sola lettura
- Aggiornamenti sull'alba
Chrome 117
- Annulla impostazione vertex buffer
- Annulla impostazione gruppo di associazione
- Silenzia gli errori derivanti dalla creazione di pipeline asincrone in caso di smarrimento del dispositivo
- Aggiornamenti della creazione dei moduli SPIR-V Shar
- Migliorare l'esperienza degli sviluppatori
- Memorizzazione nella cache delle pipeline con layout generato automaticamente
- Aggiornamenti sull'alba
Chrome 116
- Integrazione di WebCodec
- Dispositivo smarrito restituito da GPUAdapter
requestDevice()
- Mantieni una riproduzione video fluida se viene chiamato
importExternalTexture()
- Conformità delle specifiche
- Migliorare l'esperienza degli sviluppatori
- Aggiornamenti sull'alba
Chrome 115
- Estensioni lingua WGSL supportate
- Supporto sperimentale per Direct3D 11
- Usa una GPU discreta per impostazione predefinita con alimentazione CA
- Migliorare l'esperienza degli sviluppatori
- Aggiornamenti sull'alba
Chrome 114
- Ottimizzare JavaScript
- getCurrentTexture() su canvas non configurate genera un errore InvalidStateError
- Aggiornamenti di WGSL
- Aggiornamenti sull'alba