Fecha de publicación: 26 de febrero de 2025
Mejora las cargas de trabajo de aprendizaje automático con subgrupos
Después de un año de desarrollo y pruebas, ya está disponible la función WebGPU de subgrupos que habilita el paralelismo a nivel de SIMD. Permite que los subprocesos de un grupo de trabajo se comuniquen y ejecuten operaciones matemáticas colectivas, como calcular una suma de números, y ofrece un método eficiente para compartir datos entre subprocesos. Consulta la propuesta original y la entrada de chromestatus.
A modo de referencia, Google Meet registró un aumento de velocidad de entre 2.3 y 2.9 veces cuando se compararon subgrupos con productos punto enteros empaquetados para sombreadores de multiplicación de matrices vectoriales en algunos dispositivos durante la prueba de origen.
Cuando la función "subgroups"
esté disponible en un GPUAdapter
, solicita un GPUDevice
con esta función para obtener compatibilidad con subgrupos en WGSL. Es útil verificar los valores de información del adaptador subgroupMinSize
y subgroupMaxSize
, por ejemplo, si tienes un algoritmo codificado que requiere un subgrupo de un tamaño determinado.
También debes habilitar explícitamente esta extensión en tu código WGSL con enable subgroups;
para obtener acceso a los siguientes valores integrados en las etapas de sombreadores de cómputo y fragmentos:
subgroup_invocation_id
: Es un valor integrado para el índice del subproceso dentro del subgrupo.subgroup_size
: Es un valor integrado para el acceso al tamaño del subgrupo.
Las numerosas funciones integradas del subgrupo (por ejemplo, subgroupAdd()
, subgroupBallot()
, subgroupBroadcast()
, subgroupShuffle()
) permiten una comunicación y un procesamiento eficientes entre invocaciones dentro de un subgrupo. Estas operaciones de subgrupo se clasifican como operaciones de subprocesos múltiples de una sola instrucción (SIMT). Además, las funciones integradas en el cuádruple, que operan en un cuádruple de invocaciones, facilitan la comunicación de datos dentro del cuádruple.
Puedes usar valores f16 con subgrupos cuando solicitas un GPUDevice
con las funciones "shader-f16"
y "subgroups"
.
El siguiente ejemplo es un buen punto de partida para explorar subgrupos: muestra un sombreador que usa la función integrada subgroupExclusiveMul()
para calcular factoriales sin leer ni escribir memoria para comunicar resultados intermedios.
Se quitó la compatibilidad con los tipos de texturas filtrables de números de punto flotante como mezclables.
Ahora que la combinación de texturas de números de punto flotante de 32 bits está disponible con la función "float32-blendable"
, se quitó la compatibilidad incorrecta con los tipos de texturas filtrables de números de punto flotante como combinables. Consulta el problema 364987733.
Actualizaciones de Dawn
Dawn ahora requiere macOS 11 y iOS 14, y solo es compatible con Metal 2.3 y versiones posteriores. Consulta el problema 381117827.
El nuevo método GetWGSLLanguageFeatures()
de wgpu::Instance
ahora reemplaza a EnumerateWGSLLanguageFeatures()
. Consulta el problema 368672124.
Los siguientes tipos de vinculación tienen un valor Undefined
, y se cambiaron sus valores predeterminados en el diseño de vinculación. Consulta el problema 377820810.
wgpu::BufferBindingType::Undefined
ahora esUniform
.wgpu::SamplerBindingType::Undefined
ahora esFiltering
.wgpu::TextureSampleType::Undefined
ahora esFloat
.wgpu::StorageTextureAccess::Undefined
ahora esWriteOnly
Esto solo abarca algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.
Novedades de WebGPU
Una lista de todo lo que se analizó en la serie Novedades de WebGPU.
Chrome 134
- Mejora las cargas de trabajo de aprendizaje automático con subgrupos
- Se quitó la compatibilidad con los tipos de texturas filtrables de números de punto flotante como mezclables
- Actualizaciones de Dawn
Chrome 133
- Formatos de vértices adicionales unorm8x4-bgra y de 1 componente
- Permite que se soliciten límites desconocidos con un valor indefinido
- Cambios en las reglas de alineación de WGSL
- Aumentos de rendimiento de WGSL con descarte
- Cómo usar displaySize de VideoFrame para texturas externas
- Controla las imágenes con orientaciones no predeterminadas con copyExternalImageToTexture
- Cómo mejorar la experiencia de los desarrolladores
- Habilita el modo de compatibilidad con featureLevel
- Limpieza de las funciones experimentales de subgrupos
- Baja del límite de maxInterStageShaderComponents
- Actualizaciones de Dawn
Chrome 132
- Uso de la vista de textura
- Combinación de texturas de punto flotante de 32 bits
- Atributo adapterInfo de GPUDevice
- Configurar el contexto del lienzo con un formato no válido arroja un error de JavaScript
- Filtrado de restricciones de muestreador en texturas
- Experimentación de subgrupos extendidos
- Cómo mejorar la experiencia de los desarrolladores
- Compatibilidad experimental con formatos de textura normalizados de 16 bits
- Actualizaciones de Dawn
Chrome 131
- Cómo recortar distancias en WGSL
- GPUCanvasContext getConfiguration()
- Las primitivas de punto y línea no deben tener sesgo de profundidad
- Funciones integradas de análisis inclusivo para subgrupos
- Compatibilidad experimental con la función indirecta de varios dibujos
- Opción de compilación del módulo de sombreador matemática estricta
- Se quitó requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 130
- Combinación de fuentes dobles
- Mejoras en el tiempo de compilación de sombreadores en Metal
- Obsolescencia de requestAdapterInfo() de GPUAdapter
- Actualizaciones de Dawn
Chrome 129
- Compatibilidad con HDR con el modo de ajuste de tonos del lienzo
- Compatibilidad expandida con subgrupos
- Actualizaciones de Dawn
Chrome 128
- Experimenta con subgrupos
- Se dio de baja la configuración del sesgo de profundidad para líneas y puntos
- Oculta la advertencia de DevTools de error no capturado si se usa preventDefault
- WGSL interpola el muestreo primero y, luego,
- Actualizaciones de Dawn
Chrome 127
- Compatibilidad experimental con OpenGL ES en Android
- Atributo de información de GPUAdapter
- Mejoras en la interoperabilidad de WebAssembly
- Se mejoraron los errores del codificador de comandos
- Actualizaciones de Dawn
Chrome 126
- Se aumentó el límite de maxTextureArrayLayers
- Optimización de la carga de búfer para el backend de Vulkan
- Mejoras en el tiempo de compilación de sombreadores
- Los búferes de comandos enviados deben ser únicos
- Actualizaciones de Dawn
Chrome 125
- Subgrupos (función en desarrollo)
- Renderización en una porción de textura 3D
- Actualizaciones de Dawn
Chrome 124
- Texturas de almacenamiento de solo lectura y de lectura y escritura
- Compatibilidad con trabajadores de servicio y trabajadores compartidos
- Nuevos atributos de información del adaptador
- Correcciones de errores
- Actualizaciones de Dawn
Chrome 123
- Compatibilidad con funciones integradas de DP4a en WGSL
- Parámetros de puntero sin restricciones en WGSL
- Sintaxis enriquecida para la anulación de referencias de objetos compuestos en WGSL
- Estado de solo lectura independiente para los aspectos de plantilla y profundidad
- Actualizaciones de Dawn
Chrome 122
- Expande el alcance con el modo de compatibilidad (función en desarrollo)
- Aumento del límite de maxVertexAttributes
- Actualizaciones de Dawn
Chrome 121
- Compatibilidad con WebGPU en Android
- Usa DXC en lugar de FXC para la compilación de sombreadores en Windows
- Consultas de marca de tiempo en pases de renderización y procesamiento
- Puntos de entrada predeterminados a los módulos sombreadores
- Compatibilidad con display-p3 como espacio de color GPUExternalTexture
- Información de los montones de memoria
- Actualizaciones de Dawn
Chrome 120
- Compatibilidad con valores de punto flotante de 16 bits en WGSL
- Supera los límites
- Cambios en el estado del búfer de profundidad
- Actualizaciones de la información del adaptador
- Cuantización de consultas de marca de tiempo
- Funciones de limpieza de primavera
Chrome 119
- Texturas de punto flotante de 32 bits filtrables
- Formato de vértices unorm10-10-10-2
- Formato de textura rgb10a2uint
- Actualizaciones de Dawn
Chrome 118
- Compatibilidad con HTMLImageElement y ImageData en
copyExternalImageToTexture()
- Compatibilidad experimental con la textura de almacenamiento de lectura y escritura, y de solo lectura
- Actualizaciones de Dawn
Chrome 117
- Cómo anular el búfer de vértices
- Cómo anular el grupo de vinculaciones
- Silencia los errores de la creación de canalización asíncrona cuando se pierde el dispositivo
- Actualizaciones de la creación de módulos de sombreadores SPIR-V
- Cómo mejorar la experiencia de los desarrolladores
- Canalizaciones de almacenamiento en caché con diseño generado automáticamente
- Actualizaciones de Dawn
Chrome 116
- Integración de WebCodecs
- Dispositivo perdido que muestra
requestDevice()
de GPUAdapter - Mantén la reproducción de video fluida si se llama a
importExternalTexture()
- Cumplimiento de las especificaciones
- Cómo mejorar la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 115
- Extensiones de lenguaje WGSL compatibles
- Compatibilidad experimental con Direct3D 11
- Obtén una GPU discreta de forma predeterminada con alimentación de CA
- Cómo mejorar la experiencia de los desarrolladores
- Actualizaciones de Dawn
Chrome 114
- Optimiza JavaScript
- getCurrentTexture() en un lienzo sin configurar arroja InvalidStateError
- Actualizaciones de WGSL
- Actualizaciones de Dawn