Testando subgrupos
O recurso de subgrupos ativa o paralelismo no nível de SIMD, permitindo que as linhas de execução de um grupo se comuniquem e realizem operações matemáticas coletivas (por exemplo, calcular a soma de 16 números). Isso oferece uma forma altamente eficiente de compartilhamento de dados entre linhas de execução.
Uma implementação mínima da proposta de subgrupos está disponível para testes locais no "Suporte WebGPU não segura" em chrome://flags/#enable-unsafe-webgpu
.
Você também pode testar subgrupos no seu site com usuários reais. Para isso, inscreva-se no teste de origem. Leia o artigo Começar a usar testes de origem para ver instruções sobre como preparar seu site para esses testes. O teste de origem será executado no Chrome 128 ao 131 (encerramento em 19 de fevereiro de 2025). Consulte Intenção de fazer experimentos.
Quando o recurso "subgroups"
estiver disponível em um GPUAdapter
, solicite um GPUDevice
com esse recurso para receber suporte a subgrupos na WGSL e verificar os limites de minSubgroupSize
e maxSubgroupSize
.
Também é necessário ativar explicitamente essa extensão no código da WGSL com enable subgroups;
. Quando esse recurso estiver ativado, você terá acesso às seguintes adições:
subgroup_invocation_id
: um valor integrado para o índice da linha de execução no subgrupo.subgroup_size
: um valor integrado para acesso ao tamanho do subgrupo.subgroupBallot(value)
: retorna um conjunto de campos de bits em que o bit correspondente asubgroup_invocation_id
é 1 sevalue
for verdadeiro para a invocação ativa. Caso contrário, é 0.subgroupBroadcast(value, id)
: transmite ovalue
da invocação comsubgroup_invocation_id
correspondente aid
para todas as invocações dentro do subgrupo. Observação:id
precisa ser uma constante de tempo de compilação.
Mais funções integradas, como subgroupAdd
, subgroupAll
, subgroupElect
e subgroupShuffle
, serão adicionadas no futuro. Consulte o problema 354738715.
Para permitir f16 em operações de subgrupos, solicite um GPUDevice
com os recursos "subgroups"
, "subgroups-f16"
e "shader-f16"
e ative-o no código WGSL com enable f16, subgroups, subgroups_f16;
.
O snippet de código a seguir fornece uma base para mexer e descobrir o potencial dos subgrupos.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Suspender o uso da configuração de viés de profundidade para linhas e pontos
Uma mudança na especificação da WebGPU torna um erro de validação definir depthBias
, depthBiasSlopeScale
e depthBiasClamp
com um valor diferente de zero quando a topologia de um pipeline de renderização é do tipo de linha ou ponto. Para dar aos desenvolvedores tempo suficiente para atualizar o código, um aviso no Console do DevTools é mostrado sobre essa validação futura e, ao mesmo tempo, força os valores para 0 nessas circunstâncias. Consulte o problema 352567424.
Ocultar aviso de erro não capturado do DevTools se preventDefault
No Console do DevTools, os avisos para eventos uncapturederror
não serão mais exibidos se um listener de eventos para uncapturederror
tiver sido registrado e o método preventDefault()
de evento tiver sido chamado no callback do listener. Esse comportamento corresponde ao tratamento de eventos em JavaScript. Confira o exemplo a seguir e o problema 40263619 (link em inglês).
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
A WGSL interpola primeiro a amostragem
O atributo interpolate
da WGSL permite gerenciar a interpolação de dados de E/S definida pelo usuário. Agora, os novos parâmetros de amostragem de interpolação first
(padrão) e either
oferecem controle adicional: first
usa o valor do primeiro vértice do primitivo, enquanto either
permite o primeiro ou o último vértice. Consulte o problema 340278447.
Atualizações do amanhecer
A implementação do WGPUFuture da Dawn para lidar com operações assíncronas foi concluída. Os principais conceitos incluem wgpuInstanceProcessEvents para processamento de eventos oportunistas e WGPUCallbackMode para definir locais de callbacks. WGPUFuture significa eventos únicos com ciclo de vida infinito, e wgpuInstanceWaitAny aguardam a conclusão de qualquer futuro ou tempo limite. Consulte o problema 42240932.
O valor CompositeAlphaMode::Auto
agora não é informado por Surface::GetCapabilities()
. Ainda é válido e equivalente a Surface::GetCapabilities().alphaMode[0]
. Consulte o problema 292.
O back-end do OpenGL agora oferece suporte a Surface
com uma linha "y-flip" para cada chamada de Present()
. Consulte o problema 344814083.
O método Adapter::GetProperties()
foi descontinuado e substituído pelo uso de Adapter::GetInfo()
.
Jaswant, um colaborador externo, reescreveu todos os arquivos CMake, facilitando a atualização deles e permitindo pré-builds. Confira o guia de início rápido para usar o Dawn em projetos do CMake.
Isso cobre apenas alguns dos principais destaques. Confira a lista completa de confirmações (link em inglês).
Novidades da WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo na WebGPU.
Chrome 128
- Fazendo testes com subgrupos
- Suspender o uso da configuração de viés de profundidade para linhas e pontos
- Ocultar aviso de erro não capturado do DevTools se preventDefault
- A amostragem de WGSL é interpolada primeiro e
- Atualizações do amanhecer
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Erros aprimorados do codificador de comando
- Atualizações do amanhecer
Chrome 126
- Aumentar o limite de maxTextureArrayLayers
- Otimização do upload de buffer para back-end do Vulkan
- Melhorias no tempo de compilação do sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do amanhecer
Chrome 125
- Subgrupos (recurso em desenvolvimento)
- Renderizar uma fração de textura 3D
- Atualizações do amanhecer
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte aos service workers e workers compartilhados
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do amanhecer
Chrome 123
- Suporte para funções integradas do DP4a na WGSL
- Parâmetros de ponteiro irrestritos na WGSL
- Sintaxe de açúcar para desreferenciar compostos na WGSL (link em inglês)
- Estado somente leitura separado para aspectos de estêncil e de profundidade
- Atualizações do amanhecer
Chrome 122
- Expandir o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumentar o limite de maxVertexAttributes
- Atualizações do amanhecer
Chrome 121
- Suporte à WebGPU no Android
- Usar DXC em vez de FXC para compilação de sombreador no Windows
- Consultas de carimbo de data/hora em passagens de computação e renderização
- Pontos de entrada padrão para módulos de sombreador
- Suporte a display-p3 como espaço de cores GPUExternalTexture
- Informações sobre heaps de memória
- Atualizações do amanhecer
Chrome 120
- Suporte para valores de ponto flutuante de 16 bits na WGSL
- Supere os limites
- Mudanças no estado de profundidade do estêncil
- Atualizações de informações sobre os adaptadores
- Quantização de consultas de carimbo de data/hora
- Recursos para fazer faxina
Chrome 119
- Texturas flutuantes filtráveis de 32 bits
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do amanhecer
Chrome 118
- Compatibilidade de HTMLImageElement e ImageData em
copyExternalImageToTexture()
- Suporte experimental à textura de armazenamento somente leitura e leitura-gravação
- Atualizações do amanhecer
Chrome 117
- Não definir buffer de vértice
- Cancelar configuração do grupo de vinculação
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo for perdido
- Atualizações da criação do módulo de sombreador SPIR-V
- Como melhorar a experiência do desenvolvedor
- Pipelines em cache com layout gerado automaticamente
- Atualizações do amanhecer
Chrome 116
- Integração com WebCodecs
- Dispositivo perdido retornado pelo GPUAdapter
requestDevice()
- Manter a reprodução de vídeo suave se
importExternalTexture()
for chamado - Conformidade com especificações
- Como melhorar a experiência do desenvolvedor
- Atualizações do amanhecer
Chrome 115
- Extensões de idiomas da WGSL compatíveis
- Suporte experimental para Direct3D 11
- Receber uma GPU discreta por padrão com alimentação CA
- Como melhorar a experiência do desenvolvedor
- Atualizações do amanhecer
Chrome 114
- Otimizar o JavaScript
- getCurrentTexture() em uma tela não configurada gera InvalidStateError
- Atualizações da WGSL
- Atualizações do amanhecer