Publicado em 26 de fevereiro de 2025
Melhorar as cargas de trabalho de aprendizado de máquina com subgrupos
Após um ano de desenvolvimento e testes, o recurso de subgrupos da WebGPU que ativa o paralelismo no nível SIMD já está disponível. Ele permite que as linhas de execução em um grupo de trabalho se comuniquem e executem operações matemáticas coletivas, como o cálculo de uma soma de números, e oferece um método eficiente para o compartilhamento de dados entre linhas de execução. Consulte a proposta original e a entrada do chromestatus.
Para referência, o Google Meet teve um aumento de velocidade de 2,3 a 2,9 vezes ao comparar subgrupos com produtos de ponto inteiro empacotados para shaders de multiplicação de matriz-vetor em alguns dispositivos durante o teste de origem.
Quando o recurso "subgroups"
estiver disponível em um GPUAdapter
, solicite um GPUDevice
com esse recurso para receber suporte a subgrupos no WGSL. É útil verificar os valores das informações do adaptador subgroupMinSize
e subgroupMaxSize
, por exemplo, se você tiver um algoritmo codificado que exige um subgrupo de determinado tamanho.
Você também precisa ativar explicitamente essa extensão no código WGSL com enable subgroups;
para ter acesso aos seguintes valores integrados nas fases de sombreadores de computação e de fragmentos:
subgroup_invocation_id
: um valor integrado para o índice da linha dentro do subgrupo.subgroup_size
: um valor integrado para acesso ao tamanho do subgrupo.
As diversas funções integradas de subgrupo (por exemplo, subgroupAdd()
, subgroupBallot()
, subgroupBroadcast()
, subgroupShuffle()
) permitem a comunicação e a computação eficientes entre invocações em um subgrupo. Essas operações de subgrupo são classificadas como operações de thread múltipla de instrução única (SIMT, na sigla em inglês). Além disso, as funções integradas do quad, que operam em um quad de invocações, facilitam a comunicação de dados dentro do quad.
É possível usar valores f16 com subgrupos ao solicitar um GPUDevice
com os recursos "shader-f16"
e "subgroups"
.
O exemplo a seguir é um bom ponto de partida para explorar subgrupos: ele mostra um sombreador que usa a função integrada subgroupExclusiveMul()
para calcular fatores sem ler ou gravar memória para comunicar resultados intermediários.
Remover o suporte a tipos de textura com filtro de ponto flutuante como mescla
Agora que a mistura de texturas de ponto flutuante de 32 bits está disponível com o recurso "float32-blendable"
, o suporte incorreto para tipos de textura filtráveis de ponto flutuante como misturáveis foi removido. Consulte o problema 364987733.
Atualizações do Dawn
O Dawn agora exige o macOS 11 e o iOS 14 e só oferece suporte para o Metal 2.3 ou mais recente. Consulte o problema 381117827.
O novo método GetWGSLLanguageFeatures()
do wgpu::Instance
agora substitui o EnumerateWGSLLanguageFeatures()
. Consulte o problema 368672124.
Os tipos de vinculação a seguir têm um valor Undefined
e os valores padrão no layout de vinculação foram alterados. Consulte o problema 377820810.
wgpu::BufferBindingType::Undefined
agora éUniform
wgpu::SamplerBindingType::Undefined
agora éFiltering
wgpu::TextureSampleType::Undefined
agora éFloat
wgpu::StorageTextureAccess::Undefined
agora éWriteOnly
Isso abrange apenas alguns dos principais destaques. Confira a lista completa de confirmações.
Novidades na WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo na WebGPU.
Chrome 134
- Melhorar as cargas de trabalho de aprendizado de máquina com subgrupos
- Remover o suporte a tipos de textura com filtro de ponto flutuante como mescla
- Atualizações do Dawn
Chrome 133
- Formatos de vértice de 1 componente e unorm8x4-bgra adicionais
- Permitir que limites desconhecidos sejam solicitados com valor indefinido
- Mudanças nas regras de alinhamento do WGSL
- Ganhos de desempenho da WGSL com descarte
- Usar displaySize de VideoFrame para texturas externas
- Processar imagens com orientações diferentes do padrão usando copyExternalImageToTexture
- Como melhorar a experiência do desenvolvedor
- Ativar o modo de compatibilidade com o featureLevel
- Limpeza de recursos experimentais de subgrupos
- O limite maxInterStageShaderComponents foi descontinuado
- Atualizações do Dawn
Chrome 132
- Uso da visualização de textura
- Mistura de texturas de ponto flutuante de 32 bits
- Atributo adapterInfo de GPUDevice
- Configurar o contexto da tela com um formato inválido gera um erro JavaScript
- Filtrar restrições de amostragem em texturas
- Experimentação de subgrupos estendidos
- Como melhorar a experiência do desenvolvedor
- Suporte experimental para formatos de textura normalizados de 16 bits
- Atualizações do Dawn
Chrome 131
- Distâncias de corte na WGSL
- GPUCanvasContext getConfiguration()
- As primitivas de ponto e linha não podem ter viés de profundidade
- Funções integradas de verificação inclusiva para subgrupos
- Suporte experimental para multidraw indireto
- Opção de matemática rigorosa da compilação do módulo de sombreador
- O método requestAdapterInfo() do GPUAdapter foi removido
- Atualizações do Dawn
Chrome 130
- Combinação de duas origens
- Melhorias no tempo de compilação de sombreador no Metal
- Descontinuação do método requestAdapterInfo() do GPUAdapter
- Atualizações do Dawn
Chrome 129
- Suporte a HDR com o modo de mapeamento de tons da tela
- Suporte a subgrupos expandidos
- Atualizações do Dawn
Chrome 128
- Testes com subgrupos
- Descontinuação da configuração de viés de profundidade para linhas e pontos
- Ocultar o aviso do DevTools de erro não capturado se preventDefault
- A WGSL interpola a amostragem primeiro e
- Atualizações do Dawn
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Melhoria nos erros do codificador de comando
- Atualizações do Dawn
Chrome 126
- Aumento do limite de maxTextureArrayLayers
- Otimização do upload de buffer para o back-end do Vulkan
- Melhorias no tempo de compilação de sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do Dawn
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte a service workers e workers compartilhados
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do Dawn
Chrome 123
- Suporte a funções integradas do DP4a no WGSL
- Parâmetros de ponteiro irrestrito na WGSL
- Açúcar sintático para desreferenciar compósitos na WGSL
- Estado somente leitura separado para aspectos de stencil e profundidade
- Atualizações do Dawn
Chrome 122
- Ampliar o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumento do limite de maxVertexAttributes
- Atualizações do Dawn
Chrome 121
- Suporte à WebGPU no Android
- Usar DXC em vez de FXC para a compilação de shaders no Windows
- Consultas de carimbo de data/hora em transmissões de renderização e computação
- Pontos de entrada padrão para módulos de sombreador
- Suporte a display-p3 como espaço de cores de GPUExternalTexture
- Informações sobre pilhas de memória
- Atualizações do Dawn
Chrome 120
- Suporte a valores de ponto flutuante de 16 bits na WGSL
- Superar os limites
- Mudanças no estado do stencil de profundidade
- Atualizações das informações do adaptador
- Quantização de consultas de carimbo de data/hora
- Recursos de limpeza geral
Chrome 119
- Texturas de ponto flutuante de 32 bits com filtro
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do Dawn
Chrome 118
- Suporte a HTMLImageElement e ImageData em
copyExternalImageToTexture()
- Suporte experimental para textura de armazenamento de leitura/gravação e somente leitura
- Atualizações do Dawn
Chrome 117
- Buffer de vértice desativado
- Desvincular grupo
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações na criação de módulos de sombreador SPIR-V
- Como melhorar a experiência do desenvolvedor
- Armazenamento em cache de pipelines com layout gerado automaticamente
- Atualizações do Dawn
Chrome 116
- Integração com o WebCodecs
- Dispositivo perdido retornado por GPUAdapter
requestDevice()
- Manter a reprodução de vídeo suave se
importExternalTexture()
for chamado - Conformidade com as especificações
- Como melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 115
- Extensões de linguagem WGSL com suporte
- Suporte experimental para Direct3D 11
- Usar GPU discreta por padrão na alimentação CA
- Como melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 114
- Optimize JavaScript
- getCurrentTexture() em uma tela não configurada gera um erro InvalidStateError
- Atualizações da WGSL
- Atualizações do Dawn