WebGPU (Chrome→123) में नया क्या है

François Beaufort
François Beaufort

WGSL में DP4a में मौजूद फ़ंक्शन की सुविधा

DP4a (4 एलिमेंट का डॉट प्रॉडक्ट और एक्यूमुलेट), जीपीयू के निर्देशों का एक सेट है. आम तौर पर, इसका इस्तेमाल डीप लर्निंग के अनुमान में, क्वांटाइज़ेशन के लिए किया जाता है. यह सुविधा, 8-बिट वाले पूर्णांक वाले डॉट प्रॉडक्ट की बेहतर तरीके से काम करती है, ताकि ऐसे int8-क्वांटाइज़्ड मॉडल की तेज़ी से गणना की जा सके. यह सुविधा, मेमोरी और नेटवर्क बैंडविथ में 75% तक की बचत कर सकती है. साथ ही, f32 वर्शन के मुकाबले, किसी भी मशीन लर्निंग मॉडल की परफ़ॉर्मेंस को बेहतर बना सकती है. इस वजह से, अब कई लोकप्रिय एआई फ़्रेमवर्क में इसका इस्तेमाल बहुत ज़्यादा किया जा रहा है.

"packed_4x8_integer_dot_product" WGSL भाषा एक्सटेंशन navigator.gpu.wgslLanguageFeatures में मौजूद होने पर, अब आपके पास dot4U8Packed और dot4I8Packed में पहले से मौजूद फ़ंक्शन की मदद से, 8-बिट पूर्णांक वाले चार कॉम्पोनेंट वेक्टर को लिखने के लिए, WGSL शेडर कोड में डॉट प्रॉडक्ट के निर्देशों में इनपुट के तौर पर, 32-बिट इंटीजर स्केलर का इस्तेमाल किया जा सकता है. pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8, और unpack4xU8 WGSL बिल्ट-इन फ़ंक्शन के साथ, 8-बिट पूर्णांक वाले पैक किए गए 4-कॉम्पोनेंट वेक्टर के साथ भी पैकिंग और अनपैकिंग निर्देशों का इस्तेमाल किया जा सकता है.

हमारा सुझाव है कि आप अपने WGSL शेडर कोड के सबसे ऊपर requires packed_4x8_integer_dot_product; के साथ, पोर्ट न हो पाने की संभावना का संकेत देने के लिए, डायरेक्टिव का इस्तेमाल करें. यह उदाहरण देखें और समस्या का रंग:1497 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

इस स्पेसिफ़िकेशन को लागू करने और इस स्पेसिफ़िकेशन को लागू करने के लिए, शंघाई में Intel की Web Graphics टीम को धन्यवाद!

WGSL में बिना पाबंदी वाले पॉइंटर पैरामीटर

"unrestricted_pointer_parameters" WGSL भाषा एक्सटेंशन उन प्रतिबंधों को कम करता है जिनसे WGSL फ़ंक्शन में पॉइंटर पास किए जा सकते हैं:

  • उपयोगकर्ता के एलान किए गए फ़ंक्शन के लिए, storage, uniform, और workgroup ऐड्रेस स्पेस के पैरामीटर पॉइंटर.

  • उपयोगकर्ता के एलान किए गए फ़ंक्शन के लिए, सदस्यों और ऐरे एलिमेंट को स्ट्रक्चर करने के लिए पॉइंटर पास करना.

इसके बारे में ज़्यादा जानने के लिए, पॉइंटर ऐज़ फ़ंक्शन पैरामीटर | WGSL का टूर देखें.

navigator.gpu.wgslLanguageFeatures का इस्तेमाल करके, इस सुविधा का पता लगाया जा सकता है. हमारा सुझाव है कि आप अपने WGSL शेडर कोड के सबसे ऊपर, requires unrestricted_pointer_parameters; के साथ नॉन-पोर्टेबिलिटी की संभावना का संकेत देने के लिए, हमेशा डायरेक्टिव-डायरेक्टिव का इस्तेमाल करें. नीचे दिया गया उदाहरण देखें, WGSL की खास जानकारी में बदलाव और समस्या का रंग:2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

WGSL में अरिफ़रेंसिंग कंपोज़िट के लिए सिंटैक्स शुगर

जब navigator.gpu.wgslLanguageFeatures में "pointer_composite_access" WGSL भाषा एक्सटेंशन मौजूद होता है, तब आपका WGSL शेडर कोड अब एक ही डॉट (.) सिंटैक्स का इस्तेमाल करके, कॉम्प्लेक्स डेटा टाइप के कॉम्पोनेंट को ऐक्सेस करने की सुविधा देता है. भले ही, सीधे डेटा के साथ काम किया जा रहा हो या उसके पॉइंटर के साथ. यह इस तरह से काम करता है:

  • अगर foo एक पॉइंटर है: foo.bar, (*foo).bar लिखने का ज़्यादा आसान तरीका है. आम तौर पर, पॉइंटर को "रेफ़रंस" में बदलने के लिए, तारे के निशान (*) की ज़रूरत होती है. इसे अनदेखा किया जा सकता है. हालांकि, अब पॉइंटर और रेफ़रंस दोनों ही काफ़ी मिलते-जुलते हैं और इन्हें आपस में बदला जा सकता है.

  • अगर foo कोई पॉइंटर नहीं है: डॉट (.) ऑपरेटर ठीक उसी तरह काम करता है जैसे सदस्यों को सीधे तौर पर ऐक्सेस करने के लिए किया जाता है.

इसी तरह, अगर pa एक पॉइंटर है जो किसी अरे का शुरुआती पता स्टोर करता है, तो pa[i] का इस्तेमाल करने से आपको मेमोरी की उस लोकेशन को सीधा ऐक्सेस मिलता है जहां अरे का 'iवां एलिमेंट स्टोर होता है.

हमारा सुझाव है कि आप अपने WGSL शेडर कोड के सबसे ऊपर requires pointer_composite_access; के साथ, पोर्ट न हो पाने की संभावना का संकेत देने के लिए, डायरेक्टिव का इस्तेमाल करें. यह उदाहरण देखें और समस्या का रंग:2113 देखें.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

स्टेंसिल और गहराई वाले पहलुओं के लिए अलग रीड-ओनली मोड

पहले, रेंडर पास में रीड-ओनली डेप्थ-स्टेंसिल अटैचमेंट के लिए रीड-ओनली होना ज़रूरी था, यानी दोनों आसपेक्ट (डेप्थ और स्टेंसिल) थे. यह सीमा हटा दी गई है. अब गहराई के पहलू को रीड-ओनली तरीके से इस्तेमाल किया जा सकता है. जैसे, संपर्क के गहरे हिस्सों को ट्रेस करने के लिए, जबकि बाकी प्रोसेस के लिए पिक्सल की पहचान करने के लिए स्टेंसिल बफ़र को लिखा जाता है. जारी करने का समय:2146 देखें.

Dawn के अपडेट

गड़बड़ी होने पर, wgpuDeviceSetUncapturedErrorCallback() के साथ सेट किए गए, गड़बड़ी वाले कॉलबैक को अब तुरंत कॉल किया जाता है. इसे कैप्चर नहीं किया गया है. डेवलपर इसी की उम्मीद करते हैं और डीबग करना चाहते हैं. बदलाव सुबह:173620 देखें.

webgpu.h API का wgpuSurfaceGetPreferredFormat() तरीका लागू कर दिया गया है. जारी करने का समय:1362 देखें.

इसमें सिर्फ़ कुछ खास बातों के बारे में बताया गया है. कमियों की पूरी सूची देखें.

WebGPU में नया क्या है

WebGPU में नया क्या है सीरीज़ में शामिल सभी चीज़ों की सूची.

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113