Experimenta con subgrupos
La función de subgrupos habilita el paralelismo de nivel SIMD, lo que permite que los subprocesos dentro de un grupo se comuniquen y realicen operaciones matemáticas colectivas (por ejemplo, calcular la suma de 16 números). Esto proporciona una forma muy eficiente de compartir datos entre subprocesos.
Hay una implementación mínima de la propuesta de subgrupos disponible para pruebas locales detrás de la "Compatibilidad no segura con WebGPU". marca en chrome://flags/#enable-unsafe-webgpu
.
También puedes probar subgrupos en tu sitio con usuarios reales. Para ello, regístrate en la prueba de origen. Lee Comienza a usar las pruebas de origen si necesitas instrucciones para preparar tu sitio para usar las pruebas de origen. La prueba de origen se realizará de la versión 128 a la 131 de Chrome (finalizará el 19 de febrero de 2025). Consulta Intent para experimentar.
Cuando la función "subgroups"
esté disponible en un GPUAdapter
, solicita un GPUDevice
con esta función para obtener compatibilidad con los subgrupos en WGSL y verificar sus límites de minSubgroupSize
y maxSubgroupSize
.
También debes habilitar explícitamente esta extensión en tu código WGSL con enable subgroups;
. Cuando se habilita, obtienes acceso a las siguientes incorporaciones:
subgroup_invocation_id
: Es un valor integrado para el índice del subproceso dentro del subgrupo.subgroup_size
: Un valor integrado para el acceso al tamaño del subgrupo.subgroupBallot(value)
: Muestra un conjunto de campos de bits en el que el bit correspondiente asubgroup_invocation_id
es 1 sivalue
es verdadero para esa invocación activa y 0 en caso contrario.subgroupBroadcast(value, id)
: Transmite elvalue
desde la invocación consubgroup_invocation_id
que coincida conid
a todas las invocaciones dentro del subgrupo. Nota:id
debe ser una constante de tiempo de compilación.
En el futuro, se agregarán más funciones integradas, como subgroupAdd
, subgroupAll
, subgroupElect
y subgroupShuffle
. Consulta el problema 354738715.
Para permitir f16 en operaciones de subgrupos, solicita un GPUDevice
con las funciones "subgroups"
, "subgroups-f16"
y "shader-f16"
, y luego habilítalo en tu código WGSL con enable f16, subgroups, subgroups_f16;
.
El siguiente fragmento de código proporciona una base para experimentar y descubrir el potencial de los subgrupos.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Baja del sesgo de profundidad para líneas y puntos
Un cambio de especificaciones de WebGPU hace que sea un error de validación configurar depthBias
, depthBiasSlopeScale
y depthBiasClamp
en un valor distinto de cero cuando la topología de una canalización de renderización es un tipo de línea o punto. Para que los desarrolladores tengan tiempo suficiente para actualizar su código, se muestra una advertencia en la consola de Herramientas para desarrolladores sobre esta próxima validación, a la vez que se fuerza a los valores a 0 en estas circunstancias. Consulta el problema 352567424.
Ocultar la advertencia de error no capturado de Herramientas para desarrolladores si preventDefault
En la consola de Herramientas para desarrolladores, ya no se muestran las advertencias sobre los eventos uncapturederror
si se registró un objeto de escucha de eventos para uncapturederror
y se llamó al método preventDefault()
del evento en la devolución de llamada del objeto de escucha de eventos. Este comportamiento coincide con el control de eventos en JavaScript. Consulta el siguiente ejemplo y el error 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL interpola primero el muestreo y
El atributo interpolate
de WGSL te permite administrar la interpolación de datos de IO definida por el usuario. Ahora, los nuevos parámetros de muestreo interpolados first
(predeterminado) y either
te brindan un control adicional: first
usa el valor del primer vértice del primitivo, mientras que either
permite el primer o último vértice. Consulta el problema 340278447.
Actualizaciones del amanecer
Se completó la implementación de WGPUFuture de Dawn para controlar operaciones asíncronas. Los conceptos clave incluyen wgpuInstanceProcessEvents para el procesamiento de eventos oportunistas y WGPUCallbackMode para definir ubicaciones de devolución de llamada. WGPUFuture significa eventos únicos con una vida útil infinita, y wgpuInstanceWaitAny espera que se completen cualquier evento futuro o tiempo de espera. Consulta el problema 42240932.
Surface::GetCapabilities()
ahora no informa el valor de CompositeAlphaMode::Auto
. Sigue siendo válida y equivale a Surface::GetCapabilities().alphaMode[0]
. Consulta el problema 292.
El backend de OpenGL ahora admite Surface
con un botón y-flip blit para cada llamada a Present()
. Consulta el problema 344814083.
El método Adapter::GetProperties()
dejó de estar disponible y se reemplazó por Adapter::GetInfo()
.
Jas want, un colaborador externo, reescribió todos los archivos de CMake, lo que facilita su actualización y permite compilaciones previas. Consulta la guía de inicio rápido para usar Dawn en proyectos de CMake.
Esto abarca solo algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se ha abordado en la serie Novedades de WebGPU.
Chrome 128
- Experimenta con subgrupos
- Baja del sesgo de profundidad para las líneas y puntos
- Ocultar la advertencia de error no capturado de Herramientas para desarrolladores si preventDefault
- WGSL interpola el muestreo primero y, luego,
- Actualizaciones del amanecer
Chrome 127
- Compatibilidad experimental con OpenGL ES en Android
- Atributo de información de GPUAdapter
- Mejoras en la interoperabilidad de WebAssembly
- Mejoras en los errores del codificador de comandos
- Actualizaciones del amanecer
Chrome 126
- Aumenta el límite de maxTextureArrayLayers
- Optimización de carga de búfer para el backend de Vulkan
- Mejoras en el tiempo de compilación del sombreador
- Los búferes de comandos enviados deben ser únicos
- Actualizaciones del amanecer
Chrome 125
- Subgrupos (función en desarrollo)
- Cómo renderizar una porción de textura 3D
- Actualizaciones del amanecer
Chrome 124
- Texturas de almacenamiento de solo lectura y de lectura y escritura
- Asistencia para service workers y trabajadores compartidos
- Nuevos atributos de información del adaptador
- Correcciones de errores
- Actualizaciones del amanecer
Chrome 123
- Compatibilidad con funciones integradas de la DP4a en WGSL
- Parámetros de puntero no restringido en WGSL
- Azúcar de sintaxis para desreferenciar compuestos en WGSL
- Separa el estado de solo lectura para los aspectos de esténcil y profundidad
- Actualizaciones del amanecer
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumenta el límite de maxVertexAttributes
- Actualizaciones del amanecer
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para compilar sombreadores en Windows
- Consultas de marcas de tiempo en los pases de procesamiento y renderización
- Puntos de entrada predeterminados a los módulos de sombreadores
- Compatibilidad con display-p3 como espacio de color GPUExternalTexture
- Información sobre los montón de memoria
- Actualizaciones del amanecer
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera los límites
- Cambios en el estado de la plantilla de profundidad
- Actualizaciones de la información de los adaptadores
- Cuantización de consultas de marcas de tiempo
- Funciones de la limpieza de primavera
Chrome 119
- Texturas flotantes de 32 bits filtrables
- formato de vértice unorm10-10-10-2
- Formato de textura RGB10a2uint
- Actualizaciones del amanecer
Chrome 118
- Compatibilidad con ImageData y HTMLImageElement en
copyExternalImageToTexture()
- Compatibilidad experimental para texturas de almacenamiento de lectura y escritura y de solo lectura
- Actualizaciones del amanecer
Chrome 117
- Se anuló la configuración del búfer de vértices
- Anular el grupo de vinculaciones
- Silencia errores de la creación de una canalización asíncrona cuando se pierde el dispositivo
- Actualizaciones de la creación de módulos sombreadores SPIR-V
- Mejora la experiencia de los desarrolladores
- Almacenamiento de canalizaciones en caché con diseño generado automáticamente
- Actualizaciones del amanecer
Chrome 116
- Integración de WebCodecs
- Dispositivo perdido que devuelve GPUAdapter
requestDevice()
- Mantener la reproducción de video fluida si se llama a
importExternalTexture()
- Cumplimiento de las especificaciones
- Mejora la experiencia de los desarrolladores
- Actualizaciones del amanecer
Chrome 115
- Extensiones de idioma WGSL compatibles
- Compatibilidad experimental con Direct3D 11
- Obtén una GPU discreta de forma predeterminada con la alimentación de CA
- Mejora la experiencia de los desarrolladores
- Actualizaciones del amanecer
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en el lienzo no configurado arroja una InvalidStateError
- Actualizaciones de WGSL
- Actualizaciones del amanecer