WebGPU (Chrome→123) में नया क्या है

François Beaufort
François Beaufort

WGSL में DP4a के पहले से मौजूद फ़ंक्शन के लिए सहायता

DP4a (डॉट प्रॉडक्ट ऑफ़ 4 एलिमेंट ऐंड एक्युमलेट) का मतलब, जीपीयू के निर्देशों का एक सेट है. इसका इस्तेमाल आम तौर पर, डीप लर्निंग इन्फ़रेंस में क्वॉन्टाइज़ेशन के लिए किया जाता है. यह 8-बिट इंटिजर डॉट प्रॉडक्ट को असरदार तरीके से लागू करता है, ताकि int8-क्वांटाइज़्ड मॉडल की कंप्यूटिंग को तेज़ किया जा सके. यह f32 वर्शन की तुलना में, मेमोरी और नेटवर्क बैंडविथ को (75% तक) बचा सकता है. साथ ही, इन्फ़रेंस में किसी भी मशीन लर्निंग मॉडल की परफ़ॉर्मेंस को बेहतर बना सकता है. नतीजतन, अब इसका इस्तेमाल कई लोकप्रिय एआई फ़्रेमवर्क में बड़े पैमाने पर किया जाता है.

अगर "packed_4x8_integer_dot_product" WGSL भाषा एक्सटेंशन, navigator.gpu.wgslLanguageFeatures में मौजूद है, तो अब 32-बिट इंटिजर स्केलर का इस्तेमाल किया जा सकता है. इसमें 8-बिट इंटिजर के 4-कॉम्पोनेंट वेक्टर को, dot4U8Packed और dot4I8Packed के पहले से मौजूद फ़ंक्शन के साथ, आपके WGSL शेडर कोड में डॉट प्रॉडक्ट के निर्देशों के इनपुट के तौर पर पैक किया जाता है. साथ ही, WGSL के पहले से मौजूद pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8, और unpack4xU8 फ़ंक्शन की मदद से, 8-बिट इंटिजर के पैक किए गए 4-कॉम्पोनेंट वेक्टर के साथ, पैकिंग और अनपैकिंग के निर्देशों का इस्तेमाल किया जा सकता है.

WGSL शेडर कोड में सबसे ऊपर, requires packed_4x8_integer_dot_product; के साथ, requires-directive का इस्तेमाल करने का सुझाव दिया जाता है. इससे, नॉन-पोर्टेबिलिटी की संभावना का पता चलता है. यहां दिया गया उदाहरण और समस्या tint:1497 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

इस स्पेसिफ़िकेशन और इसके लागू करने की प्रोसेस को पूरा करने के लिए, शंघाई में मौजूद Intel की वेब ग्राफ़िक्स टीम को हमारा खास धन्यवाद!

WGSL में, पॉइंटर पैरामीटर पर कोई पाबंदी नहीं

"unrestricted_pointer_parameters" WGSL भाषा एक्सटेंशन, WGSL फ़ंक्शन में पास किए जा सकने वाले पॉइंटर पर लगी पाबंदियों को कम करता है:

  • उपयोगकर्ता के तय किए गए फ़ंक्शन के लिए, storage, uniform, और workgroup के पता स्पेस के पैरामीटर पॉइंटर.

  • उपयोगकर्ता के तय किए गए फ़ंक्शन के लिए, स्ट्रक्चर के सदस्यों और कलेक्शन के एलिमेंट को पॉइंटर पास करना.

इसके बारे में ज़्यादा जानने के लिए, फ़ंक्शन पैरामीटर के तौर पर पॉइंटर | WGSL का टूर देखें.

navigator.gpu.wgslLanguageFeatures का इस्तेमाल करके, इस सुविधा का पता लगाया जा सकता है. WGSL शेडर कोड में सबसे ऊपर, requires unrestricted_pointer_parameters; के साथ, requires-directive का इस्तेमाल करने का सुझाव दिया जाता है. इससे, नॉन-पोर्टेबिलिटी की संभावना का पता चलता है. यहां दिया गया उदाहरण, WGSL के स्पेसिफ़िकेशन में किए गए बदलाव, और समस्या tint:2053 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

WGSL में, कंपोज़िट को डीरेफ़रंस करने के लिए सिंटैक्स शुगर

अगर "pointer_composite_access" WGSL भाषा एक्सटेंशन, navigator.gpu.wgslLanguageFeatures में मौजूद है, तो अब आपके WGSL शेडर कोड में, जटिल डेटा टाइप के कॉम्पोनेंट को ऐक्सेस किया जा सकता है. इसके लिए, एक ही डॉट (.) सिंटैक्स का इस्तेमाल किया जाता है. भले ही, आप सीधे डेटा के साथ काम कर रहे हों या उसके पॉइंटर के साथ. यह इस तरह से काम करता है:

  • अगर foo एक पॉइंटर है, तो foo.bar, (*foo).bar लिखने का ज़्यादा आसान तरीका है. आम तौर पर, पॉइंटर को "रेफ़रंस" में बदलने के लिए तारामंडल (*) की ज़रूरत होती है. हालांकि, अब पॉइंटर और रेफ़रंस, दोनों एक जैसे हैं और इन्हें एक-दूसरे की जगह इस्तेमाल किया जा सकता है.

  • अगर foo एक पॉइंटर नहीं है, तो डॉट (.) ऑपरेटर ठीक उसी तरह काम करता है जैसे सदस्यों को सीधे ऐक्सेस करने के लिए किया जाता है.

इसी तरह, अगर pa एक पॉइंटर है, जो कलेक्शन का शुरुआती पता सेव करता है, तो pa[i] का इस्तेमाल करने पर, आपको उस मेमोरी लोकेशन का सीधा ऐक्सेस मिलता है जहां उस कलेक्शन का 'i'th एलिमेंट सेव होता है.

WGSL शेडर कोड में सबसे ऊपर, requires pointer_composite_access; के साथ, requires-directive का इस्तेमाल करने का सुझाव दिया जाता है. इससे, नॉन-पोर्टेबिलिटी की संभावना का पता चलता है. यहां दिया गया उदाहरण और समस्या tint:2113 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

स्टेंसिल और डेप्थ ऐस्पेक्ट के लिए, रीड-ओनली स्टेट को अलग करना

पहले, रेंडर पास में रीड-ओनली डेप्थ-स्टेंसिल अटैचमेंट के लिए, दोनों ऐस्पेक्ट (डेप्थ और स्टेंसिल) को रीड-ओनली होना ज़रूरी था. अब यह पाबंदी हटा दी गई है. अब डेप्थ ऐस्पेक्ट को रीड-ओनली फ़ैशन में इस्तेमाल किया जा सकता है. उदाहरण के लिए, कॉन्टैक्ट शैडो ट्रेसिंग के लिए. वहीं, स्टेंसिल बफ़र को, आगे की प्रोसेसिंग के लिए पिक्सल की पहचान करने के लिए लिखा जाता है. समस्या dawn:2146 देखें.

Dawn से जुड़े अपडेट

wgpuDeviceSetUncapturedErrorCallback() के साथ सेट किया गया, कैप्चर न की गई गड़बड़ी का कॉलबैक अब गड़बड़ी होने पर तुरंत कॉल किया जाता है. डेवलपर, डीबग करने के लिए लगातार यही उम्मीद करते हैं और चाहते हैं. बदलाव dawn:173620 देखें.

wgpuSurfaceGetPreferredFormat() तरीका webgpu.h एपीआई से लागू किया गया है. समस्या dawn:1362 देखें.

इसमें सिर्फ़ कुछ मुख्य हाइलाइट शामिल हैं. कमिट की पूरी सूची देखें.

WebGPU में नया क्या है

WebGPU में नया क्या है सीरीज़ में शामिल की गई सभी चीज़ों की सूची.

Chrome 147-148

Chrome 146

Chrome 145

Chrome 144

Chrome 143

Chrome 142

Chrome 141

Chrome 140

Chrome 139

Chrome 138

Chrome 137

Chrome 136

Chrome 135

Chrome 134

Chrome 133

Chrome 132

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113