发布时间:2025 年 2 月 26 日
使用子群组改进机器学习工作负载
经过一年的开发和试用,支持 SIMD 级并行的子组 WebGPU 功能现已推出。它允许工作组中的线程进行通信和执行集体数学运算(例如计算数字的总和),并提供一种高效的跨线程数据共享方法。请参阅原始提案和 chromestatus 条目。
仅供参考,在原始试用期间,在某些设备上针对矩阵-矢量乘法着色器对子群组进行基准测试时,Google Meet 的速度提高了 2.3-2.9 倍。
当 GPUAdapter
中提供 "subgroups"
功能时,请请求具有此功能的 GPUDevice
,以便在 WGSL 中获得子组支持。检查 subgroupMinSize
和 subgroupMaxSize
适配器信息值会很有帮助,例如,如果您有一个硬编码的算法需要特定大小的子群组。
您还需要使用 enable subgroups;
在 WGSL 代码中明确启用此扩展,才能在计算和片段着色器阶段访问以下内置值:
subgroup_invocation_id
:子组中线程索引的内置值。subgroup_size
:用于访问子群组大小的内置值。
众多子群组内置函数(例如 subgroupAdd()
、subgroupBallot()
、subgroupBroadcast()
、subgroupShuffle()
)可在子群组内的调用之间实现高效的通信和计算。这些子组操作被归类为单指令多线程 (SIMT) 操作。此外,四元组内置函数可对调用的四元组进行运算,从而促进四元组内的数据通信。
当您请求同时包含 "shader-f16"
和 "subgroups"
地图项的 GPUDevice
时,可以将 f16 值与子组搭配使用。
以下示例是探索子组的好起点:它展示了一个着色器,该着色器使用 subgroupExclusiveMul()
内置函数计算阶乘,而无需读取或写入内存来传达中间结果。
移除了对可作为可混合类型的浮点可过滤纹理类型的支持
现在,"float32-blendable"
功能支持 32 位浮点纹理混合,因此移除了对浮点可过滤纹理类型作为可混合的纹理的错误支持。请参阅问题 364987733。
Dawn 更新
Dawn 现在需要 macOS 11 和 iOS 14,并且仅支持 Metal 2.3 及更高版本。请参阅问题 381117827。
wgpu::Instance
的新 GetWGSLLanguageFeatures()
方法现已取代 EnumerateWGSLLanguageFeatures()
。请参阅问题 368672124。
以下绑定类型具有 Undefined
值,并且其在绑定布局中的默认值已更改。请参阅问题 377820810。
wgpu::BufferBindingType::Undefined
现为Uniform
wgpu::SamplerBindingType::Undefined
现在为Filtering
wgpu::TextureSampleType::Undefined
现为Float
wgpu::StorageTextureAccess::Undefined
现已更名为WriteOnly
本文仅介绍了一些主要亮点。查看详尽的提交内容列表。
WebGPU 中的新变化
WebGPU 新变化系列中涵盖的所有内容的列表。
Chrome 134
Chrome 133
- 额外的 unorm8x4-bgra 和 1 个组成部分的顶点格式
- 允许使用未定义的值请求未知限制
- WGSL 对齐规则变更
- 使用舍弃功能提升了 WGSL 性能
- 为外部纹理使用 VideoFrame displaySize
- 使用 copyExternalImageToTexture 处理非默认方向的图片
- 改进开发者体验
- 使用 featureLevel 启用兼容模式
- 清理实验性子群组功能
- 废弃了 maxInterStageShaderComponents 限制
- Dawn 更新
Chrome 132
- TextureView 用法
- 32 位浮点纹理混合
- GPUDevice adapterInfo 属性
- 使用无效格式配置画布上下文会抛出 JavaScript 错误
- 过滤纹理上的采样器限制
- 扩展了小组实验
- 改进开发者体验
- 对 16 位归一化纹理格式的实验性支持
- Dawn 更新
Chrome 131
- 在 WGSL 中剪裁距离
- GPUCanvasContext getConfiguration()
- 点和线基元不得有深度偏差
- 针对子群组的包含性扫描内置函数
- 对多绘制间接的实验性支持
- 着色器模块编译选项“严格数学”
- 移除了 GPUAdapter requestAdapterInfo()
- Dawn 更新
Chrome 130
Chrome 129
Chrome 128
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- 支持 Android 上的 WebGPU
- 在 Windows 上使用 DXC 而非 FXC 进行着色器编译
- 计算和渲染通道中的时间戳查询
- 着色器模块的默认入口点
- 支持将 display-p3 用作 GPUExternalTexture 色彩空间
- 内存堆信息
- Dawn 更新
Chrome 120
Chrome 119
Chrome 118
Chrome 117
Chrome 116
- WebCodecs 集成
- GPUAdapter
requestDevice()
返回的丢失设备 - 在调用
importExternalTexture()
时保持视频流畅播放 - 规范合规性
- 改进开发者体验
- Dawn 更新