Mit Untergruppen experimentieren
Die Funktion „Untergruppen“ ermöglicht Parallelität auf SIMD-Ebene, sodass Threads innerhalb einer Gruppe miteinander kommunizieren und gemeinsame mathematische Operationen ausführen können, z. B. die Berechnung der Summe von 16 Zahlen. Dies ermöglicht eine äußerst effiziente Form der threadübergreifenden Datenfreigabe.
Eine minimale Implementierung des Vorschlags für Untergruppen ist für lokale Tests unter chrome://flags/#enable-unsafe-webgpu
mit dem Flag „Unsafe WebGPU Support“ verfügbar.
Sie können auch Untergruppen auf Ihrer Website mit echten Nutzern testen, indem Sie sich für den Origin-Test registrieren. In der Anleitung zu Ursprungstests erfahren Sie, wie Sie Ihre Website für Ursprungstests vorbereiten. Der Ursprungstest läuft von Chrome 128 bis 131 (Ende: 19. Februar 2025). Weitere Informationen finden Sie unter Testabsicht.
Wenn die "subgroups"
-Funktion in einer GPUAdapter
verfügbar ist, fordern Sie eine GPUDevice
mit dieser Funktion an, um die Unterstützung von Untergruppen in WGSL zu erhalten und die minSubgroupSize
- und maxSubgroupSize
-Limits zu prüfen.
Außerdem müssen Sie diese Erweiterung in Ihrem WGSL-Code mit enable subgroups;
explizit aktivieren. Wenn die Option aktiviert ist, erhalten Sie Zugriff auf die folgenden zusätzlichen Funktionen:
subgroup_invocation_id
: Ein vordefinierter Wert für den Index des Threads innerhalb der Untergruppe.subgroup_size
: Ein vordefinierter Wert für den Zugriff auf die Größe von Untergruppen.subgroupBallot(value)
: Gibt eine Reihe von Bitfeldern zurück, bei denen das Bit, dassubgroup_invocation_id
entspricht, den Wert 1 hat, wennvalue
für diese aktive Aufrufung wahr ist, andernfalls den Wert 0.subgroupBroadcast(value, id)
: Überträgt dievalue
aus der Aufrufabfolge mitsubgroup_invocation_id
, die mitid
übereinstimmt, an alle Aufrufe innerhalb der Untergruppe. Hinweis:id
muss eine Compile-Zeitkonstante sein.
Weitere integrierte Funktionen wie subgroupAdd
, subgroupAll
, subgroupElect
und subgroupShuffle
werden in Zukunft hinzugefügt. Siehe Problem 354738715.
Wenn du f16 in Untergruppen-Vorgängen zulassen möchtest, fordere eine GPUDevice
mit den Funktionen "subgroups"
, "subgroups-f16"
und "shader-f16"
an und aktiviere sie dann in deinem WGSL-Code mit enable f16, subgroups, subgroups_f16;
.
Das folgende Code-Snippet dient als Ausgangspunkt, um mit den Untergruppen zu experimentieren und ihr Potenzial zu entdecken.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Einstellung der Tiefenverzerrung für Linien und Punkte eingestellt
Aufgrund einer Änderung der WebGPU-Spezifikation ist es nun ein Validierungsfehler, depthBias
, depthBiasSlopeScale
und depthBiasClamp
auf einen Wert ungleich null festzulegen, wenn die Topologie einer Renderpipeline einen Linien- oder Punkttyp hat. Damit Entwickler genügend Zeit haben, ihren Code zu aktualisieren, wird in der Entwicklertools-Konsole eine Warnung zu dieser bevorstehenden Validierung angezeigt. Außerdem werden die Werte in diesen Fällen auf 0 gesetzt. Siehe Problem 352567424.
DevTools-Warnung für nicht erfasste Fehler bei preventDefault ausblenden
In der DevTools-Konsole werden keine Warnungen mehr für uncapturederror
-Ereignisse angezeigt, wenn ein Ereignislistener für uncapturederror
registriert wurde und die Ereignismethode preventDefault()
im Callback des Ereignislisteners aufgerufen wurde. Dieses Verhalten entspricht der Ereignisbehandlung in JavaScript. Weitere Informationen finden Sie im folgenden Beispiel und in Issue 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL interpoliert zuerst die Stichprobe und führt dann entweder
Mit dem WGSL-Attribut interpolate
können Sie die benutzerdefinierte Interpolation von IO-Daten verwalten. Mit den neuen Interpolations-Stichprobenparametern first
(Standard) und either
haben Sie jetzt noch mehr Möglichkeiten: Bei first
wird der Wert des ersten Vertices des Primitives verwendet, bei either
entweder der erste oder der letzte Vertex. Siehe Problem 340278447.
Dawn-Updates
Die Implementierung von Dawns WGPUFuture für die Verarbeitung asynchroner Vorgänge ist jetzt abgeschlossen. Zu den wichtigsten Konzepten gehören wgpuInstanceProcessEvents für die opportunistische Ereignisverarbeitung und WGPUCallbackMode zum Definieren von Rückruforten. WGPUFuture steht für einmalige Ereignisse mit einer unendlichen Lebensdauer und wgpuInstanceWaitAny wartet auf den Abschluss eines beliebigen Future oder eines Zeitlimits. Siehe Problem 42240932.
Der Wert CompositeAlphaMode::Auto
wird jetzt nicht mehr von Surface::GetCapabilities()
erfasst. Er ist weiterhin gültig und entspricht Surface::GetCapabilities().alphaMode[0]
. Siehe Problem 292.
Das OpenGL-Backend unterstützt jetzt Surface
mit einem Y-Flip-Blit für jeden Present()
-Aufruf. Siehe Problem 344814083.
Die Methode Adapter::GetProperties()
wurde zugunsten von Adapter::GetInfo()
eingestellt.
Jaswant, ein externer Mitwirkender, hat alle CMake-Dateien neu geschrieben, sodass sie leichter aktualisiert werden können und Pre-Builds möglich sind. In der Kurzanleitung erfahren Sie, wie Sie Dawn in CMake-Projekten verwenden.
Dies sind nur einige der wichtigsten Highlights. Eine vollständige Liste der Commits
Das ist neu bei WebGPU
Eine Liste aller Themen, die in der Reihe Was ist neu in WebGPU? behandelt wurden.
Chrome 132
- Verwendung der Texturansicht
- 32-Bit-Gleitkommatextur-Mischverfahren
- Attribut „adapterInfo“ von „GPUDevice“
- Bei der Konfiguration des Canvas-Kontexts mit einem ungültigen Format wird ein JavaScript-Fehler geworfen
- Einschränkungen für Filter-Sampler bei Texturen
- Erweiterte Tests mit Untergruppen
- Entwicklerfreundlichkeit verbessern
- Experimentelle Unterstützung für 16-Bit-normalisierte Texturformate
- Updates zu Dawn
Chrome 131
- Entfernungen in WGSL zuschneiden
- GPUCanvasContext getConfiguration()
- Punkt- und Linienprimitive dürfen keine Tiefenverzerrung haben.
- Integrierte Funktionen für inklusiven Scan für Untergruppen
- Experimentelle Unterstützung für indirekte Multi-Draw-Anweisungen
- Shader-Modul-Kompilierungsoption „strict math“
- GPUAdapter-Methode „requestAdapterInfo()“ entfernen
- Updates zu Dawn
Chrome 130
- Zusammenführen von zwei Quellen
- Verbesserte Shader-Kompilierungszeiten unter Metal
- Einstellung der GPUAdapter-Methode „requestAdapterInfo()“
- Updates zu Dawn
Chrome 129
- HDR-Unterstützung mit Canvas-Tone-Mapping-Modus
- Erweiterter Support für Untergruppen
- Updates zu Dawn
Chrome 128
- Mit Untergruppen experimentieren
- Einstellung der Tiefenverzerrung für Linien und Punkte eingestellt
- Nicht erfasste Fehlerwarnung in den Entwicklertools bei preventDefault ausblenden
- WGSL interpoliert zuerst die Stichprobe und
- Updates zu Dawn
Chrome 127
- Experimenteller Support für OpenGL ES auf Android-Geräten
- Attribut „info“ von „GPUAdapter“
- Verbesserungen bei der WebAssembly-Interoperabilität
- Verbesserte Fehlermeldungen beim Befehls-Encoder
- Updates zu Dawn
Chrome 126
- Maximale Anzahl von Texture-Array-Ebenen erhöhen
- Optimierung des Pufferuploads für das Vulkan-Backend
- Verbesserte Shader-Kompilierungszeiten
- Eingereichte Befehlspuffere müssen eindeutig sein.
- Updates zu Dawn
Chrome 125
Chrome 124
- Lese- und Lese-/Schreibspeichertextur
- Unterstützung für Dienst- und freigegebene Worker
- Neue Attribute für Adapterinformationen
- Diverse Fehlerkorrekturen
- Updates zu Dawn
Chrome 123
- Unterstützung für integrierte DP4a-Funktionen in WGSL
- Uneingeschränkte Zeigerparameter in WGSL
- Syntax-Optimierung für die Dereferenzierung von Kompositen in WGSL
- Separater schreibgeschützter Status für Stencil- und Tiefenansichten
- Updates zu Dawn
Chrome 122
- Reichweite mit Kompatibilitätsmodus erhöhen (Funktion in Entwicklung)
- Limit für maxVertexAttributes erhöhen
- Updates zu Dawn
Chrome 121
- Unterstützung von WebGPU auf Android-Geräten
- DXC anstelle von FXC für die Shaderkompilierung unter Windows verwenden
- Zeitstempelabfragen in Compute- und Rendering-Passes
- Standardeinstiegspunkte in Shadermodule
- Unterstützung von display-p3 als GPUExternalTexture-Farbraum
- Informationen zu Speicherheaps
- Updates zu Dawn
Chrome 120
- Unterstützung von 16‑Bit-Gleitkommawerten in WGSL
- Grenzen überschreiten
- Änderungen am Tiefen-/Schatten-Status
- Aktualisierte Informationen zu Adaptern
- Quantisierung von Zeitstempelabfragen
- Funktionen für den Frühjahrsputz
Chrome 119
- Filterbare 32-Bit-Gleitkommatextur
- unorm10-10-10-2-Vertex-Format
- rgb10a2uint-Texturformat
- Updates zu Dawn
Chrome 118
- Unterstützung von HTMLImageElement und ImageData in
copyExternalImageToTexture()
- Experimentelle Unterstützung für Lese-/Schreib- und schreibgeschützte Speichertextur
- Updates zu Dawn
Chrome 117
- Vertex-Buffer zurücksetzen
- Bindungsgruppe aufheben
- Fehler bei der Erstellung einer asynchronen Pipeline bei verlorenem Gerät ignorieren
- Änderungen beim Erstellen von SPIR-V-Shadermodulen
- Entwicklerfreundlichkeit verbessern
- Pipelines mit automatisch generiertem Layout im Cache speichern
- Updates zu Dawn
Chrome 116
- WebCodecs-Integration
- Verlorenes Gerät, das von GPUAdapter
requestDevice()
zurückgegeben wurde - Videowiedergabe bei Aufruf von
importExternalTexture()
flüssig halten - Einhaltung der Spezifikationen
- Entwicklerfreundlichkeit verbessern
- Updates zu Dawn
Chrome 115
- Unterstützte WGSL-Spracherweiterungen
- Experimentelle Unterstützung für Direct3D 11
- Unterstützung für diskrete GPU standardmäßig bei Wechselstromversorgung
- Entwicklerfreundlichkeit verbessern
- Updates zu Dawn
Chrome 114
- JavaScript optimieren
- Bei nicht konfiguriertem Canvas wird bei getCurrentTexture() ein InvalidStateError geworfen
- WGSL-Updates
- Updates zu Dawn