Compatibilidad con funciones integradas de DP4a en WGSL
DP4a (producto punto de 4 elementos y Acumular) se refiere a un conjunto de instrucciones de GPU que se usan comúnmente en la inferencia de aprendizaje profundo para la cuantización. Realiza con eficiencia los productos escalares de números enteros de 8 bits para acelerar el cálculo de estos modelos int8-cuantizados. Puede ahorrar (hasta un 75%) de memoria y ancho de banda de red, y mejorar el rendimiento de cualquier modelo de aprendizaje automático en la formulación de inferencias en comparación con su versión f32. Como resultado, ahora se usa mucho en muchos frameworks de IA populares.
Cuando la extensión de idioma WGSL "packed_4x8_integer_dot_product"
está presente en navigator.gpu.wgslLanguageFeatures
, ahora puedes usar escalares enteros de 32 bits que empaquetan vectores de 4 componentes de números enteros de 8 bits como entradas a las instrucciones del producto punto en el código de sombreador WGSL con las funciones integradas dot4U8Packed
y dot4I8Packed
. También puedes usar instrucciones de empaquetado y desempaquetado con vectores de 4 componentes empaquetados de números enteros de 8 bits con las funciones integradas pack4xI8
, pack4xU8
, pack4xI8Clamp
, pack4xU8Clamp
, unpack4xI8
y unpack4xU8
de WGSL.
Se recomienda usar una require-directive para indicar la posibilidad de no portabilidad con requires packed_4x8_integer_dot_product;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y el tint del problema:1497.
if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
throw new Error(`DP4a built-in functions are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires packed_4x8_integer_dot_product;
fn main() {
const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
}`,
});
Queremos dar un agradecimiento especial al equipo de Web Graphics de Intel en Shanghái por completar esta especificación e implementación.
Parámetros de puntero sin restricciones en WGSL
La extensión de idioma WGSL "unrestricted_pointer_parameters"
disminuye las restricciones sobre qué punteros se pueden pasar a funciones WGSL:
Punteros de parámetros de espacios de direcciones
storage
,uniform
yworkgroup
para funciones declaradas por el usuarioPasar punteros para estructurar miembros y elementos de array a funciones declaradas por el usuario
Consulta Punteros como parámetros de función | Recorrido por WGSL para obtener más información.
Esta función se puede detectar con navigator.gpu.wgslLanguageFeatures
. Se recomienda que siempre uses una require-directive para indicar la posibilidad de no portabilidad con requires unrestricted_pointer_parameters;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo, los cambios en las especificaciones de WGSL y el tono de problema:2053.
if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
throw new Error(`Unrestricted pointer parameters are not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires unrestricted_pointer_parameters;
@group(0) @binding(0) var<storage, read_write> S : i32;
fn func(pointer : ptr<storage, i32, read_write>) {
*pointer = 42;
}
@compute @workgroup_size(1)
fn main() {
func(&S);
}`
});
Sintaxis edulcorada para desreferenciar compuestos en WGSL
Cuando la extensión de lenguaje WGSL "pointer_composite_access"
está presente en navigator.gpu.wgslLanguageFeatures
, el código del sombreador WGSL ahora admite el acceso a componentes de tipos de datos complejos con la misma sintaxis de punto (.
), ya sea que trabajes directamente con los datos o con un puntero hacia ellos. Aquí te mostramos cómo funciona:
Si
foo
es un puntero,foo.bar
es una forma más conveniente de escribir(*foo).bar
. Por lo general, se necesitaría el asterisco (*
) para convertir el puntero en una "referencia" que se pueda desreferenciar, pero ahora ambos punteros y referencias son mucho más similares y casi intercambiables.Si
foo
no es un puntero, el operador de punto (.
) funciona exactamente como sueles hacerlo para acceder a los miembros directamente.
Del mismo modo, si pa
es un puntero que almacena la dirección inicial de un array, usar pa[i]
te brinda acceso directo a la ubicación de la memoria donde se almacena el elemento 'i
de ese array.
Se recomienda usar una require-directive para indicar la posibilidad de no portabilidad con requires pointer_composite_access;
en la parte superior del código del sombreador WGSL. Consulta el siguiente ejemplo y el tint del problema:2113.
if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
throw new Error(`Pointer composite access is not available`);
}
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
const shaderModule = device.createShaderModule({ code: `
requires pointer_composite_access;
fn main() {
var a = vec3f();
let p : ptr<function, vec3f> = &a;
let r1 = (*p).x; // always valid.
let r2 = p.x; // requires pointer composite access.
}`
});
Separar el estado de solo lectura para los aspectos de plantilla y profundidad
Anteriormente, los adjuntos de plantillas de profundidad de solo lectura en pases de renderización requerían que ambos aspectos (profundidad y plantilla) fueran de solo lectura. Se retiró esta limitación. Ahora, puedes usar el aspecto de profundidad en modo de solo lectura, por ejemplo, para el seguimiento de la sombra de contacto, mientras que el búfer de plantillas se escribe con el objetivo de identificar píxeles para su posterior procesamiento. Consulta issue dawn:2146.
Actualizaciones del amanecer
La devolución de llamada de error no capturada establecida con wgpuDeviceSetUncapturedErrorCallback()
ahora se llama de inmediato cuando se produce el error. Esto es lo que los desarrolladores esperan y desean constantemente para la depuración. Consulta cambio dawn:173620.
Se implementó el método wgpuSurfaceGetPreferredFormat()
de la API de webgpu.h. Consulta issue dawn:1362.
Esto abarca solo algunos de los aspectos más destacados. Consulta la lista detallada de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se aborda en la serie Novedades de WebGPU.
Chrome 125
Chrome 124
- Texturas de almacenamiento de solo lectura y lectura y escritura
- Asistencia para service workers y trabajadores compartidos
- Nuevos atributos de información de adaptadores
- Correcciones de errores
- Actualizaciones del amanecer
Chrome 123
- Compatibilidad con funciones integradas de la DP4a en WGSL
- Parámetros de puntero sin restricciones en WGSL
- Sintaxis edulcorada para desreferenciar compuestos en WGSL
- Estado de solo lectura independiente para los aspectos de plantilla y profundidad
- Actualizaciones del amanecer
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumenta el límite de maxVertexAttributes
- Actualizaciones del amanecer
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para la compilación de sombreadores en Windows
- Consultas de marcas de tiempo en pases de procesamiento y renderización
- Puntos de entrada predeterminados a módulos de sombreador
- Compatibilidad con display-p3 como espacio de color GPUExternalTexture
- Información de montón de memoria
- Actualizaciones del amanecer
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera los límites
- Cambios en el estado de la plantilla de profundidad
- Actualizaciones de la información del adaptador
- Cuantización de consultas de marca de tiempo
- Funciones de la limpieza de primavera
Chrome 119
- Texturas flotantes filtrables de 32 bits
- formato unorm10-10-10-2 de vértices
- Formato de textura rgb10a2uint
- Actualizaciones del amanecer
Chrome 118
- Compatibilidad con ImageData y HTMLImageElement en
copyExternalImageToTexture()
- Compatibilidad experimental para texturas de almacenamiento de lectura y escritura y solo lectura
- Actualizaciones del amanecer
Chrome 117
- Anula el búfer de vértices
- Anular configuración de grupo de vinculaciones
- Cómo silenciar errores de la creación de canalizaciones asíncronas cuando se pierde el dispositivo
- Actualizaciones de creación del módulo de sombreador SPIR-V
- Mejora de la experiencia de los desarrolladores
- Almacena canalizaciones en caché con un diseño generado automáticamente
- Actualizaciones del amanecer
Chrome 116
- Integración de WebCodecs
- Dispositivo perdido devuelto por GPUAdapter
requestDevice()
- Mantener la reproducción de video fluida si se llama a
importExternalTexture()
- Cumplimiento de las especificaciones
- Mejora de la experiencia de los desarrolladores
- Actualizaciones del amanecer
Chrome 115
- Extensiones de idioma WGSL compatibles
- Compatibilidad experimental con Direct3D 11
- Obtén GPU discreta de forma predeterminada con alimentación de CA
- Mejora de la experiencia de los desarrolladores
- Actualizaciones del amanecer
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en lienzo no configurado genera InvalidStateError.
- Actualizaciones de WGSL
- Actualizaciones del amanecer