WGSL में 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के साथ काम करता है
WGSL में, f16
टाइप IEEE-754 बाइनरी 16 (हाफ़ सटीक) फ़ॉर्मैट के 16-बिट फ़्लोटिंग-पॉइंट वैल्यू का सेट है. इसका मतलब है कि यह फ़्लोटिंग-पॉइंट नंबर को दिखाने के लिए, 16 बिट का इस्तेमाल करता है, जबकि पारंपरिक सिंगल-प्रीसिज़न फ़्लोटिंग-पॉइंट (f32
) के लिए 32 बिट का इस्तेमाल करता है. इस छोटे साइज़ की वजह से, परफ़ॉर्मेंस में अहम सुधार हो सकते हैं. खास तौर पर, जब ज़्यादा डेटा प्रोसेस किया जाता है.
तुलना के लिए, Apple M1 Pro डिवाइस पर, WebLLM चैट डेमो में इस्तेमाल किए गए Llama2 7B मॉडल के f16
को लागू करने पर, f32
को लागू करने की प्रोसेस काफ़ी तेज़ है. पहले से भरी हुई स्पीड में 28% और डिकोड करने की स्पीड में 41% सुधार हुआ है, जैसा कि इन स्क्रीनशॉट में दिखाया गया है.
सभी जीपीयू, 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के साथ काम नहीं करते. GPUAdapter
में "shader-f16"
सुविधा उपलब्ध होने पर, इस सुविधा के साथ GPUDevice
का अनुरोध किया जा सकता है. साथ ही, ऐसा WGSL शेडर मॉड्यूल बनाया जा सकता है जो आधी वैल्यू वाले फ़्लोटिंग-पॉइंट टाइप f16
का फ़ायदा लेता है. इस टाइप का इस्तेमाल WGSL शेडर मॉड्यूल में सिर्फ़ तब किया जा सकता है, जब enable f16;
के साथ f16
WGSL एक्सटेंशन को चालू किया जाता है. ऐसा न करने पर, createShaderModule() की पुष्टि करने से जुड़ी गड़बड़ी जनरेट की जाएगी. नीचे दिया गया कम से कम उदाहरण और जारी करने का समय:1510 देखें.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
alias
की मदद से, WGSL शेडर मॉड्यूल कोड में f16
और f32
, दोनों टाइप के साथ काम किया जा सकता है. हालांकि, यह "shader-f16"
सुविधा के हिसाब से काम करता है, जैसा कि इस स्निपेट में दिखाया गया है.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
पूरा ज़ोर लगाएं
सभी कलर अटैचमेंट में, रेंडर होने वाले पाइपलाइन आउटपुट डेटा का एक सैंपल (पिक्सल या सब-पिक्सल) होल्ड करने के लिए, ज़्यादा से ज़्यादा बाइट की संख्या डिफ़ॉल्ट रूप से 32 बाइट होती है. अब maxColorAttachmentBytesPerSample
की सीमा का इस्तेमाल करके, 64 तक के ऐक्सेस का अनुरोध किया जा सकता है. नीचे दिया गया उदाहरण देखें और जारी है:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
सभी प्लैटफ़ॉर्म पर, इंटर-स्टेज कम्यूनिकेशन के लिए इस्तेमाल की जाने वाली maxInterStageShaderVariables
और maxInterStageShaderComponents
की सीमाएं बढ़ा दी गई हैं. ज़्यादा जानकारी के लिए, issues dawn:1448 देखें.
शेडर स्टेज के लिए, स्टोरेज बफ़र होने पर, पाइपलाइन लेआउट में बाइंड ग्रुप लेआउट एंट्री की ज़्यादा से ज़्यादा संख्या डिफ़ॉल्ट रूप से आठ होती है. अब maxStorageBuffersPerShaderStage
की सीमा का इस्तेमाल करके, 10 तक के ऐक्सेस का अनुरोध किया जा सकता है. रिलीज़ सुबह:2159 देखें.
maxBindGroupsPlusVertexBuffers
की नई सीमा जोड़ दी गई है. इसमें बाइंड ग्रुप और वर्टेक्स बफ़र स्लॉट की ज़्यादा से ज़्यादा संख्या, एक साथ इस्तेमाल की जाती है और सबसे ज़्यादा इंडेक्स के नीचे मौजूद खाली स्लॉट की गिनती होती है. इसकी डिफ़ॉल्ट वैल्यू 24 है. रिलीज़ सुबह:1849 देखें.
डेप्थ-स्टेंसिल की स्थिति में बदलाव
डेवलपर के अनुभव को बेहतर बनाने के लिए, अब हमेशा डेप्थ-स्टेंसिल की स्थिति depthWriteEnabled
और depthCompare
एट्रिब्यूट की ज़रूरत नहीं होती: depthWriteEnabled
सिर्फ़ डेप्थ वाले फ़ॉर्मैट के लिए ज़रूरी है. अगर डेप्थ वाले फ़ॉर्मैट का बिलकुल भी इस्तेमाल नहीं किया जाता है, तो depthCompare
की ज़रूरत नहीं होती है. जारी करने का समय:2132 देखें.
अडैप्टर की जानकारी से जुड़े अपडेट
जब उपयोगकर्ता chrome://flags/#enable-webgpu-developer-features
पर "WebGPU डेवलपर सुविधाएं" फ़्लैग चालू करता है, तो requestAdapterInfo() को कॉल करने पर, नॉन-स्टैंडर्ड type
और backend
अडैप्टर जानकारी एट्रिब्यूट अब उपलब्ध होंगे. type
में "अलग-अलग जीपीयू", "इंटिग्रेट किया गया जीपीयू", "सीपीयू" या "जानकारी नहीं" हो सकता है. backend
"WebGPU", "D3D11", "D3D12", "मेटल", "vulkan", "openGL", "openGLES" या "null" है. जारी करने का समय:2112 और जारी करने का समय:2107 देखें.
requestAdapterInfo() में मौजूद unmaskHints
सूची का वैकल्पिक पैरामीटर हटा दिया गया है. समस्या सुबह:1427 देखें.
टाइमस्टैंप क्वेरी क्वांटाइज़ेशन
टाइमस्टैंप क्वेरी की मदद से, ऐप्लिकेशन नैनोसेकंड के हिसाब से जीपीयू के निर्देशों का पालन करने में लगने वाले समय का पता लगा सकते हैं. हालांकि, समय के अटैक से जुड़ी समस्याओं की वजह से, WebGPU स्पेसिफ़िकेशन में टाइमस्टैंप क्वेरी का इस्तेमाल करना ज़रूरी नहीं होता है. Chrome की टीम का मानना है कि टाइमस्टैंप क्वेरी का डेटा कैलकुलेट करने से, क्वेरी का रिज़ॉल्यूशन कम करके 100 माइक्रोसेकंड हो जाता है. ऐसे में, क्वेरी के नतीजों की सटीक जानकारी और सुरक्षा बेहतर होती है. रिलीज़ सुबह:1800 देखें.
Chrome में, उपयोगकर्ता chrome://flags/#enable-webgpu-developer-features
पर "WebGPU डेवलपर सुविधाएं" फ़्लैग को चालू करके, टाइमस्टैंप क्वांटाइज़ेशन को बंद कर सकते हैं. ध्यान दें कि सिर्फ़ यह फ़्लैग, "timestamp-query"
सुविधा को चालू नहीं करता. इसे लागू करने की प्रोसेस अब भी एक्सपेरिमेंट के तौर पर है. इसलिए, chrome://flags/#enable-unsafe-webgpu
पर "असुरक्षित WebGPU सहायता" फ़्लैग ज़रूरी है.
Dawn में, "timestamp_quantization" नाम का एक नया डिवाइस टॉगल जोड़ा गया है और यह डिफ़ॉल्ट रूप से चालू रहता है. नीचे दिए गए स्निपेट में आपको डिवाइस का अनुरोध करते समय, टाइमस्टैंप क्वांटाइज़ेशन के बिना प्रयोग के तौर पर शुरू की गई "timestamp-क्वेरी" सुविधा को अनुमति देने का तरीका बताया गया है.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
वसंत की सफ़ाई से जुड़ी सुविधाएं
डेवलपर को साफ़ तौर पर यह बताने के लिए कि यह सुविधा प्रयोग के तौर पर है और अभी सिर्फ़ Chromium-आधारित ब्राउज़र में उपलब्ध है, प्रयोग के तौर पर शुरू की गई "timestamp-query-inside-passes" सुविधा का नाम बदलकर "chromium-experimental-timestamp-query-inside-passes" कर दिया गया है. किताब सुबह:1193 देखें.
प्रयोग के तौर पर इस्तेमाल की जा रही "Pipeline-metric-query" सुविधा को पूरी तरह से हटा दिया गया है, क्योंकि इसे अब डेवलप नहीं किया जा रहा है. Chromium से जुड़ी समस्या:1177506 देखें.
इसमें सिर्फ़ कुछ खास बातों के बारे में बताया गया है. कमियों की पूरी सूची देखें.
WebGPU में नया क्या है
WebGPU में नया क्या है सीरीज़ में शामिल सभी चीज़ों की सूची.
Chrome 125
Chrome 124
- रीड-ओनली और रीड-राइट स्टोरेज टेक्सचर
- सर्विस वर्कर और कर्मचारियों से जुड़ी सहायता
- अडैप्टर की जानकारी से जुड़े नए एट्रिब्यूट
- गड़बड़ियां ठीक करना
- Dawn के बारे में अपडेट
Chrome 123
- DP4a में पहले से मौजूद फ़ंक्शन, WGSL में काम करते हैं
- WGSL में बिना पाबंदी वाले पॉइंटर पैरामीटर
- WGSL में डिफ़रेंसिंग कंपोज़िट के लिए सिंटैक्स शुगर
- स्टेंसिल और गहराई के पहलुओं के लिए अलग-अलग रीड-ओनली मोड
- Dawn के बारे में अपडेट
Chrome 122
- कपैसिटी मोड की मदद से पहुंच बढ़ाना (यह सुविधा अभी डेवलप की जा रही है)
- maxVertexAttributes की सीमा बढ़ाएं
- Dawn के बारे में अपडेट
Chrome 121
- Android पर WebGPU की मदद करना
- Windows पर शेडर कंपाइलेशन के लिए, FXC के बजाय DXC का इस्तेमाल करना
- कंप्यूट और रेंडर पास में टाइमस्टैंप क्वेरी
- शेडर मॉड्यूल के लिए डिफ़ॉल्ट एंट्री पॉइंट
- Display-p3 को जीपीयूएक्सटर्नल टेक्सचर कलर स्पेस के तौर पर इस्तेमाल करें
- मेमोरी के हीप की जानकारी
- Dawn के बारे में अपडेट
Chrome 120
- WGSL में 16-बिट फ़्लोटिंग-पॉइंट वैल्यू के साथ काम करता है
- सीमाएं पूरी करें
- डेप्थ-स्टेंसिल के स्टेटस में बदलाव
- अडैप्टर की जानकारी से जुड़े अपडेट
- टाइमस्टैंप क्वेरी को कैलकुलेट करना
- वसंत की सफ़ाई से जुड़ी सुविधाएं
Chrome 119
- फ़िल्टर की जा सकने वाली 32-बिट फ़्लोट टेक्सचर
- unorm10-10-10-2 वर्टेक्स फ़ॉर्मैट
- debug10a2uint टेक्सचर फ़ॉर्मैट
- Dawn के बारे में अपडेट
Chrome 118
copyExternalImageToTexture()
में HTMLImageElement और ImageData से जुड़ी सहायता- रीड-राइट और रीड-ओनली स्टोरेज टेक्सचर के लिए एक्सपेरिमेंट के तौर पर काम करने की सुविधा
- Dawn के बारे में अपडेट
Chrome 117
- वर्टेक्स बफ़र को अनसेट करें
- बाइंड ग्रुप को अनसेट करें
- डिवाइस खो जाने पर, एक साथ काम नहीं करने वाली पाइपलाइन बनने से जुड़ी गड़बड़ियों की आवाज़ बंद करना
- SPIR-V शेडर मॉड्यूल बनाने के बारे में अपडेट
- डेवलपर के अनुभव को बेहतर बनाना
- अपने-आप जनरेट हुए लेआउट की मदद से पाइपलाइन को कैश मेमोरी में सेव करना
- Dawn के बारे में अपडेट
Chrome 116
- WebCodecs इंटिग्रेशन
- जीपीयू अडैप्टर
requestDevice()
से मिला खोया हुआ डिवाइस - अगर
importExternalTexture()
कॉल किया जा रहा है, तो वीडियो बिना किसी रुकावट के चलाएं - खास जानकारी का पालन
- डेवलपर के अनुभव को बेहतर बनाना
- Dawn के बारे में अपडेट
Chrome 115
- इसके साथ काम करने वाले WGSL भाषा एक्सटेंशन
- Direct3D 11 के लिए एक्सपेरिमेंटल सहायता
- एसी पावर पर डिफ़ॉल्ट रूप से डिस्क्रीट जीपीयू पाएं
- डेवलपर के अनुभव को बेहतर बनाना
- Dawn के बारे में अपडेट
Chrome 114
- JavaScript को ऑप्टिमाइज़ करना
- कॉन्फ़िगर नहीं किए गए कैनवस पर getCurrentTexture(), अमान्य राज्य गड़बड़ी देता है
- WGSL से जुड़े अपडेट
- Dawn के बारे में अपडेट