Suporte para funções integradas do DP4a na WGSL
O DP4a (Dot Product of 4 Elements and Accumulate) se refere a um conjunto de instruções de GPU comumente usadas na inferência de aprendizado profundo para quantização. Ele executa com eficiência produtos de pontos inteiros de 8 bits para acelerar o cálculo desses modelos quantizados int8. Ele pode economizar (até 75%) da memória e da largura de banda da rede e melhorar o desempenho de qualquer modelo de aprendizado de máquina na inferência em comparação com a versão f32. Como resultado, ele é muito usado em muitos frameworks de IA conhecidos.
Quando a extensão de linguagem WGSL "packed_4x8_integer_dot_product"
está presente em navigator.gpu.wgslLanguageFeatures
, é possível usar escalares de número inteiro de 32 bits que empacotam vetores de 4 componentes de números inteiros de 8 bits como entradas para as instruções de produto de ponto no código do sombreador WGSL com as funções integradas dot4U8Packed
e dot4I8Packed
. Você também pode usar instruções de empacotamento e desempacotamento com vetores de quatro componentes de 8 bits de números inteiros com pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
e unpack4xU8
funções integradas do WGSL.
É recomendável usar uma diretiva requires para indicar o potencial de não portabilidade com requires packed_4x8_integer_dot_product;
na parte de cima do código do sombreador WGSL. Confira o exemplo a seguir e issue tint:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Agradecemos especialmente à equipe de gráficos da Web da Intel em Xangai por concluir esta especificação e implementação.
Parâmetros de ponteiro irrestrito no WGSL
A extensão de linguagem WGSL "unrestricted_pointer_parameters"
afrouxa as restrições sobre quais ponteiros podem ser transmitidos para funções WGSL:
Ponteiros de parâmetro de espaços de endereço
storage
,uniform
eworkgroup
para funções declaradas pelo usuário.Transmitir ponteiros para estruturar membros e elementos de matriz em funções declaradas pelo usuário.
Confira Ponteiros como parâmetros de função | Tour da WGSL para saber mais.
Esse recurso pode ser detectado usando navigator.gpu.wgslLanguageFeatures
. É recomendável sempre usar uma required-directive para sinalizar o potencial de não portabilidade com requires unrestricted_pointer_parameters;
na parte superior do código de sombreador da WGSL. Confira o exemplo a seguir, as mudanças na especificação do WGSL e o issue tint:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Sintaxe simplificada para desreferenciar compósitos no WGSL
Quando a extensão de linguagem WGSL "pointer_composite_access"
está presente em navigator.gpu.wgslLanguageFeatures
, o código do sombreador WGSL agora oferece suporte ao acesso a componentes de tipos de dados complexos usando a mesma sintaxe de ponto (.
), seja trabalhando diretamente com os dados ou com um ponteiro para eles. Veja como funciona:
Se
foo
for um ponteiro:foo.bar
é uma maneira mais conveniente de escrever(*foo).bar
. O asterisco (*
) normalmente seria necessário para transformar o ponteiro em uma "referência" que pode ser desreferenciada, mas agora os ponteiros e as referências são muito mais semelhantes e quase intercambiáveis.Se
foo
não for um ponteiro: o operador de ponto (.
) funciona exatamente como você está acostumado para acessar membros diretamente.
Da mesma forma, se pa
for um ponteiro que armazena o endereço inicial de uma matriz, o uso de pa[i]
vai dar acesso direto ao local da memória em que o 'i
º elemento dessa matriz está armazenado.
É recomendável usar uma diretiva requires para indicar o potencial de não portabilidade com requires pointer_composite_access;
na parte de cima do código do sombreador WGSL. Confira o exemplo a seguir e a tonalidade do problema:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Estado somente leitura separado para aspectos de stencil e profundidade
Antes, os anexos de estêncil de profundidade somente leitura nas passagens de renderização exigiam que os dois aspectos (profundidade e estêncil) fossem somente leitura. Essa limitação foi removida. Agora, é possível usar o aspecto de profundidade em modo somente leitura, para o rastreamento de sombra de contato, por exemplo, enquanto o buffer de stencil é gravado para identificar pixels para processamento posterior. Consulte o problema dawn:2146.
Atualizações do amanhecer
O callback de erro não capturado definido com wgpuDeviceSetUncapturedErrorCallback()
agora é chamado imediatamente quando o erro acontece. É isso que os desenvolvedores esperam e querem para depuração. Consulte change dawn:173620.
O método wgpuSurfaceGetPreferredFormat()
da API webgpu.h foi implementado. Consulte o problema dawn:1362.
Isso abrange apenas alguns dos principais destaques. Confira a lista completa de confirmações.
Novidades da WebGPU
Uma lista de tudo o que foi abordado na série O que há de novo na WebGPU.
Chrome 131
- Distâncias de corte na WGSL
- GPUCanvasContext getConfiguration()
- Os primitivos de ponto e linha não podem ter viés de profundidade
- Funções integradas da verificação inclusiva para subgrupos
- Compatibilidade experimental com o recurso indireto de vários desenhos
- Opção de compilação do módulo do sombreador: matemática rigorosa
- O método requestAdapterInfo() do GPUAdapter foi removido
- Atualizações do Dawn
Chrome 130
- Combinação de duas origens
- Melhorias no tempo de compilação de sombreador no Metal
- Descontinuação do método requestAdapterInfo() do GPUAdapter
- Atualizações do amanhecer
Chrome 129
- Suporte a HDR com o modo de mapeamento de tons da tela
- Suporte a subgrupos expandidos
- Atualizações do Dawn
Chrome 128
- Testar subgrupos
- Suspender o uso da configuração de viés de profundidade para linhas e pontos
- Ocultar o aviso do DevTools de erro não capturado se preventDefault
- A WGSL interpola a amostragem primeiro e
- Atualizações do amanhecer
Chrome 127
- Suporte experimental para OpenGL ES no Android
- Atributo de informações do GPUAdapter
- Melhorias na interoperabilidade do WebAssembly
- Erros aprimorados do codificador de comando
- Atualizações do Dawn
Chrome 126
- Aumento do limite de maxTextureArrayLayers
- Otimização de upload de buffer para o back-end do Vulkan
- Melhorias no tempo de compilação do sombreador
- Os buffers de comando enviados precisam ser exclusivos
- Atualizações do Dawn
Chrome 125
Chrome 124
- Texturas de armazenamento somente leitura e leitura/gravação
- Suporte a service workers e workers compartilhados
- Novos atributos de informações do adaptador
- Correções de bugs
- Atualizações do Dawn
Chrome 123
- Suporte a funções integradas do DP4a no WGSL
- Parâmetros de ponteiro irrestrito na WGSL
- Açúcar sintático para desreferenciar compósitos na WGSL
- Estado somente leitura separado para aspectos de estêncil e de profundidade
- Atualizações do Dawn
Chrome 122
- Ampliar o alcance com o modo de compatibilidade (recurso em desenvolvimento)
- Aumento do limite de maxVertexAttributes
- Atualizações do Dawn
Chrome 121
- Suporte à WebGPU no Android
- Usar DXC em vez de FXC para compilação de sombreador no Windows
- Consultas de carimbo de data/hora em passagens de computação e renderização
- Pontos de entrada padrão para módulos de sombreador
- Suporte a display-p3 como espaço de cores de GPUExternalTexture
- Informações sobre heaps de memória
- Atualizações do Dawn
Chrome 120
- Suporte para valores de ponto flutuante de 16 bits na WGSL
- Superar os limites
- Mudanças no estado do stencil de profundidade
- Atualizações das informações do adaptador
- Quantização de consultas de carimbo de data/hora
- Recursos de limpeza geral
Chrome 119
- Texturas flutuantes de 32 bits com filtro
- Formato de vértice unorm10-10-10-2
- Formato de textura rgb10a2uint
- Atualizações do amanhecer
Chrome 118
- Compatibilidade de HTMLImageElement e ImageData em
copyExternalImageToTexture()
- Suporte experimental para textura de armazenamento de leitura/gravação e somente leitura
- Atualizações do Dawn
Chrome 117
- Buffer de vértice não definido
- Cancelar configuração do grupo de vinculação
- Silenciar erros da criação de pipeline assíncrono quando o dispositivo é perdido
- Atualizações da criação do módulo de sombreador SPIR-V
- Como melhorar a experiência do desenvolvedor
- Armazenamento em cache de pipelines com layout gerado automaticamente
- Atualizações do Dawn
Chrome 116
- Integração com o WebCodecs
- Dispositivo perdido retornado por GPUAdapter
requestDevice()
- Manter a reprodução de vídeo suave se
importExternalTexture()
for chamado - Conformidade com as especificações
- Como melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 115
- Extensões de linguagem WGSL com suporte
- Suporte experimental para Direct3D 11
- Acessar a GPU discreta por padrão na alimentação CA
- Como melhorar a experiência do desenvolvedor
- Atualizações do Dawn
Chrome 114
- Otimizar o JavaScript
- getCurrentTexture() em uma tela não configurada gera um erro InvalidStateError
- Atualizações da WGSL
- Atualizações do Dawn