Neuerungen bei WebGPU (Chrome 123)

François Beaufort
François Beaufort

Unterstützung für integrierte DP4a-Funktionen in WGSL

DP4a (Dot Product of 4 Elements and Accumulate) bezieht sich auf eine Reihe von GPU-Anweisungen, die häufig bei der Deep-Learning-Inferenz zur Quantisierung verwendet werden. Es führt effizient 8‑Bit-Ganzzahl-Skalarprodukte durch, um die Berechnung solcher int8-quantifizierten Modelle zu beschleunigen. Damit lassen sich bis zu 75 % Arbeitsspeicher und Netzwerkbandbreite sparen und die Leistung aller Modelle für maschinelles Lernen bei der Inferenz im Vergleich zur F32-Version verbessern. Daher wird es inzwischen intensiv in vielen beliebten KI-Frameworks verwendet.

Wenn die "packed_4x8_integer_dot_product" WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures vorhanden ist, können Sie jetzt 32‑Bit-Ganzzahlskaläre mit 4‑Komponenten-Vektoren von 8‑Bit-Ganzzahlen als Eingaben für die Anweisungen zur Punktproduktberechnung in Ihrem WGSL-Shadercode mit den integrierten Funktionen dot4U8Packed und dot4I8Packed verwenden. Sie können auch Pack- und Entpackanweisungen mit verpackten 4‑Komponenten-Vektoren von 8‑Bit-Ganzzahlen mit den integrierten WGSL-Funktionen pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8 und unpack4xU8 verwenden.

Es wird empfohlen, eine requires-Anweisung zu verwenden, um das Potenzial für die Nicht-Portierbarkeit mit requires packed_4x8_integer_dot_product; oben im WGSL-Shadercode anzugeben. Weitere Informationen finden Sie im folgenden Beispiel und unter issue tint:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Ein besonderer Dank geht an das Web Graphics-Team von Intel in Shanghai, das diese Spezifikation und Implementierung bis zum Ende vorangetrieben hat.

Uneingeschränkte Zeigerparameter in WGSL

Die WGSL-Spracherweiterung "unrestricted_pointer_parameters" lockert die Einschränkungen für die Übergabe von Verweisen an WGSL-Funktionen:

  • Parameter-Pointer der Adressräume storage, uniform und workgroup zu von Nutzern deklarierten Funktionen.

  • Übergabe von Zeigern an Strukturmitglieder und Array-Elemente an vom Nutzer deklarierte Funktionen.

Weitere Informationen finden Sie unter Pointers As Function Parameters | Tour of WGSL.

Diese Funktion kann mit navigator.gpu.wgslLanguageFeatures erkannt werden. Es wird empfohlen, immer eine requires-directive zu verwenden, um das Potenzial einer Nicht-Portabilität mit requires unrestricted_pointer_parameters; am Anfang deines WGSL-Shader-Codes zu signalisieren. Im folgenden Beispiel findest du die Änderungen der WGSL-Spezifikationen und issue tint:2053 (Problem tint:2053).

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Syntax-Optimierung für die Dereferenzierung von Kompositen in WGSL

Wenn die "pointer_composite_access" WGSL-Spracherweiterung in navigator.gpu.wgslLanguageFeatures vorhanden ist, unterstützt Ihr WGSL-Shadercode jetzt den Zugriff auf Komponenten komplexer Datentypen mit derselben Syntax mit Punkt (.), unabhängig davon, ob Sie direkt mit den Daten oder mit einem Verweis darauf arbeiten. So funktionierts:

  • Wenn foo ein Verweis ist: foo.bar ist eine praktischere Schreibweise für (*foo).bar. Das Sternchen (*) wäre normalerweise erforderlich, um den Zeiger in eine „Bezug“ zu verwandeln, die dereferenziert werden kann. Jetzt sind aber sowohl die Zeiger als auch die Bezüge viel ähnlicher und fast austauschbar.

  • Wenn foo kein Verweis ist: Der Punktoperator (.) funktioniert genau wie gewohnt, um direkt auf Elemente zuzugreifen.

Wenn pa ein Zeiger ist, der die Startadresse eines Arrays speichert, erhalten Sie mit pa[i] direkten Zugriff auf den Speicherort, an dem das 'i. Element dieses Arrays gespeichert ist.

Es wird empfohlen, eine requires-Anweisung zu verwenden, um das Potenzial für die Nicht-Portierbarkeit mit requires pointer_composite_access; oben im WGSL-Shadercode anzugeben. Siehe das folgende Beispiel und issue tint:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Separater Lesezugriffsstatus für Stencil- und Tiefenansichten

Bisher mussten bei schreibgeschützten Tiefen-/Masken-Anhängen in Rendering-Pässen beide Aspekte (Tiefe und Maske) schreibgeschützt sein. Diese Einschränkung wurde aufgehoben. Sie können den Tiefenbereich jetzt schreibgeschützt verwenden, z. B. für das Zeichnen von Kontaktschatten, während der Stencil-Puffer geschrieben wird, um Pixel für die weitere Verarbeitung zu identifizieren. Siehe Problem dawn:2146.

Updates zur Morgendämmerung

Der mit wgpuDeviceSetUncapturedErrorCallback() festgelegte Callback für nicht erfasste Fehler wird jetzt sofort aufgerufen, wenn der Fehler auftritt. Das ist es, was Entwickler bei der Fehlerbehebung erwarten und wünschen. Siehe change dawn:173620.

Die Methode wgpuSurfaceGetPreferredFormat() aus der webgpu.h API wurde implementiert. Siehe Problem dawn:1362.

Dies sind nur einige der wichtigsten Highlights. Vollständige Liste der Commits

Das ist neu bei WebGPU

Eine Liste aller Themen, die in der Reihe Was ist neu in WebGPU? behandelt wurden.

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113