使用子群组进行实验
子群组功能支持 SIMD 级并行处理,让同一组中的线程能够进行通信和执行集体数学运算(例如计算 16 个数字的总和)。这提供了一种高效的跨线程数据共享方式。
子组提案的最小实现可在 chrome://flags/#enable-unsafe-webgpu
的“Unsafe WebGPU Support”(不安全的 WebGPU 支持)标志后面用于本地测试。
您还可以注册参与起源试用,在您的网站上使用真实用户试用子群组。如需了解如何准备网站以使用源代码试用版,请参阅开始使用源代码试用版。源试用将从 Chrome 128 到 Chrome 131 进行(截止时间为 2025 年 2 月 19 日)。请参阅意图实验。
当 GPUAdapter
中提供 "subgroups"
功能时,请请求具有此功能的 GPUDevice
,以便在 WGSL 中获得子组支持,并检查其 minSubgroupSize
和 maxSubgroupSize
限制。
您还需要在 WGSL 代码中使用 enable subgroups;
明确启用此扩展。启用后,您可以使用以下增强功能:
subgroup_invocation_id
:子组中线程索引的内置值。subgroup_size
:用于访问子群组大小的内置值。subgroupBallot(value)
:返回一组位字段,其中与subgroup_invocation_id
对应的位为 1,表示相应有效调用的value
为 true;否则为 0。subgroupBroadcast(value, id)
:将调用中的value
广播到子组中的所有调用,其中subgroup_invocation_id
与id
匹配。注意:id
必须是编译时常量。
我们日后会添加更多内置函数,例如 subgroupAdd
、subgroupAll
、subgroupElect
、subgroupShuffle
。请参阅问题 354738715。
如需允许在子组运算中使用 f16,请使用 "subgroups"
、"subgroups-f16"
和 "shader-f16"
功能请求 GPUDevice
,然后使用 enable f16, subgroups, subgroups_f16;
在 WGSL 代码中启用它。
以下代码段提供了一个基础,可供您调整和发掘子群组的潜力。
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
废弃了为线条和点设置深度偏差的功能
WebGPU 规范变更:如果渲染管道的拓扑为线条或点类型,将 depthBias
、depthBiasSlopeScale
和 depthBiasClamp
设置为非零值会导致验证错误。为让开发者有足够的时间更新其代码,开发者工具控制台会显示一条警告,告知即将进行的验证,同时在这种情况下强制将值设为 0。请参阅问题 352567424。
使用 preventDefault 时,隐藏未捕获的错误开发者工具警告
如果已注册 uncapturederror
的事件监听器,并且在事件监听器回调中调用了事件 preventDefault()
方法,则开发者工具控制台中将不再显示有关 uncapturederror
事件的警告。此行为与 JavaScript 中的事件处理方式一致。请参阅以下示例和问题 40263619。
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL 会先插值采样,然后执行以下操作之一:
借助 WGSL interpolate
属性,您可以管理用户定义的 IO 数据插值。现在,新的插值采样参数 first
(默认)和 either
可让您进行更精细的控制:first
使用基元第一个顶点的值,而 either
允许使用第一个或最后一个顶点。请参阅问题 340278447。
Dawn 更新
用于处理异步操作的 Dawn 的 WGPUFuture 实现现已完成。关键概念包括用于机会性事件处理的 wgpuInstanceProcessEvents,以及用于定义回调位置的 WGPUCallbackMode。WGPUFuture 表示具有无限生命周期的一次性事件,而 wgpuInstanceWaitAny 会等待任何 Future 完成或超时。请参阅问题 42240932。
Surface::GetCapabilities()
现在不会报告 CompositeAlphaMode::Auto
值。它仍然有效,并且等效于 Surface::GetCapabilities().alphaMode[0]
。请参阅问题 292。
OpenGL 后端现在支持 Surface
,并针对每次 Present()
调用执行 y 翻转 blitting。请参阅问题 344814083。
Adapter::GetProperties()
方法已被弃用,请改用 Adapter::GetInfo()
。
外部贡献者 Jaswant 重写了所有 CMake 文件,使其更易于更新,并支持预构建。如需了解如何在 CMake 项目中使用 Dawn,请参阅快速入门指南。
这仅涵盖了一些主要亮点。查看详尽的提交内容列表。
WebGPU 中的新变化
WebGPU 新变化系列中涵盖的所有内容的列表。
Chrome 132
- TextureView 用法
- 32 位浮点纹理混合
- GPUDevice adapterInfo 属性
- 使用无效格式配置画布上下文会抛出 JavaScript 错误
- 过滤纹理上的采样器限制
- 扩展了小组实验
- 改进开发者体验
- 对 16 位归一化纹理格式的实验性支持
- Dawn 更新
Chrome 131
- 在 WGSL 中剪裁距离
- GPUCanvasContext getConfiguration()
- 点和线基元不得有深度偏差
- 针对子群组的包含性扫描内置函数
- 对多绘制间接的实验性支持
- 着色器模块编译选项“严格数学”
- 移除了 GPUAdapter requestAdapterInfo()
- Dawn 更新
Chrome 130
Chrome 129
Chrome 128
Chrome 127
Chrome 126
Chrome 125
Chrome 124
Chrome 123
Chrome 122
Chrome 121
- 支持 Android 上的 WebGPU
- 在 Windows 上使用 DXC 而非 FXC 进行着色器编译
- 计算和渲染通道中的时间戳查询
- 着色器模块的默认入口点
- 支持将 display-p3 用作 GPUExternalTexture 色彩空间
- 内存堆信息
- Dawn 更新
Chrome 120
Chrome 119
Chrome 118
Chrome 117
Chrome 116
- WebCodecs 集成
- GPUAdapter
requestDevice()
返回的丢失设备 - 在调用
importExternalTexture()
时保持视频流畅播放 - 规范合规性
- 改进开发者体验
- Dawn 更新