WebGPU'daki (Chrome 120) Yenilikler

François Beaufort
François Beaufort

WGSL'de 16 bit kayan nokta değerleri desteği

WGSL'de f16 türü, IEEE-754 ikili16 (yarım kesinlik) biçiminin 16 bitlik kayan nokta değerleri grubudur. Geleneksel tek duyarlıklı kayan nokta (f32) için 32 bit yerine, kayan nokta sayısını temsil etmek için 16 bit kullandığı anlamına gelir. Bu küçük boyut, özellikle büyük miktarlarda veri işlenirken önemli performans iyileştirmeleri sağlayabilir.

Karşılaştırmak gerekirse, Apple M1 Pro cihazlarda WebLLM sohbet demosunda kullanılan Llama2 7B modellerinin f16 uygulaması, f32 uygulamasına kıyasla önemli ölçüde daha hızlıdır. Aşağıdaki ekran görüntülerinde gösterildiği gibi önceden doldurma hızında% 28 ve kod çözme hızında% 41 iyileşme elde edilmiştir.

f32 ve f16 Llama2 7B modellerini içeren WebLLM sohbet demolarının ekran görüntüsü.
f32 (solda) ve f16 (sağ) Lama2 7B modelleriyle webLLM sohbet demoları.

Tüm GPU'lar 16 bit kayan nokta değerlerini desteklemez. "shader-f16" özelliği GPUAdapter içinde kullanılabilir olduğunda, artık bu özellikle bir GPUDevice isteğinde bulunabilir ve yarı hassasiyetli kayan nokta türünden f16 yararlanan bir WGSL gölgelendirici modülü oluşturabilirsiniz. Bu tür, yalnızca enable f16; ile f16 WGSL uzantısını etkinleştirirseniz WGSL gölgelendirici modülünde kullanılmak üzere geçerlidir. Aksi takdirde, createShaderModule() doğrulama hatası oluşturur. Aşağıdaki minimal örneği ve issue sawn:1510'ı inceleyin.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
  throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
  requiredFeatures: ["shader-f16"],
});

const code = `
  enable f16;

  @compute @workgroup_size(1)
  fn main() {
    const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
  }
`;

const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...

Aşağıdaki snippet'te gösterildiği gibi, "shader-f16" özellik desteğine bağlı olarak WGSL gölgelendirici modülü kodunda hem f16 hem de f32 türleri alias ile desteklenebilir.

const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");

const device = await adapter.requestDevice({
  requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});

const header = hasShaderF16
  ? `enable f16;
     alias min16float = f16;`
  : `alias min16float = f32;`;

const code = `
  ${header}

  @compute @workgroup_size(1)
  fn main() {
    const c = vec3<min16float>(1.0, 2.0, 3.0);
  }
`;

Sınırları zorlayın

Tüm renk eklerinde, oluşturma ardışık düzeni çıkış verilerinin bir örneğini (piksel veya alt piksel) tutmak için gereken maksimum bayt sayısı varsayılan olarak 32 bayttır. Artık maxColorAttachmentBytesPerSample sınırını kullanarak 64 kullanıcıya kadar istek gönderebilirsiniz. Aşağıdaki örneği inceleyin ve issue dawn:2036'yı inceleyin.

const adapter = await navigator.gpu.requestAdapter();

if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
  // When the desired limit isn't supported, take action to either fall back to
  // a code path that does not require the higher limit or notify the user that
  // their device does not meet minimum requirements.
}

// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
  requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});

Aşamalar arası iletişim için kullanılan maxInterStageShaderVariables ve maxInterStageShaderComponents sınırları tüm platformlarda artırıldı. Ayrıntılar için sorunun geleceği:1448'e bakın.

Her gölgelendirici aşaması için bir ardışık düzen düzeninde depolama arabelleği olan maksimum bağlama grubu düzeni girişi sayısı varsayılan olarak 8'dir. Artık maxStorageBuffersPerShaderStage sınırını kullanarak 10 kullanıcıya kadar isteyebilirsiniz. issue dawn:2159'a bakın.

Yeni bir maxBindGroupsPlusVertexBuffers sınırı eklendi. En yüksek dizinin altındaki boş alanlar da dahil olmak üzere, aynı anda kullanılan maksimum bağlama grubu ve köşe arabellek slotu sayısından oluşur. Varsayılan değeri 24'tür. issue Dawn:1849'u inceleyin.

Derinlik şablonundaki değişiklikler

Geliştirici deneyimini iyileştirmek için derinlik şablon durumu depthWriteEnabled ve depthCompare özellikleri artık her zaman gerekli değildir: depthWriteEnabled, yalnızca derinliğe sahip biçimler için gereklidir ve hiç kullanılmadığı takdirde derinlik içeren biçimler için depthCompare gerekli değildir. issue dawn:2132'yi inceleyin.

Bağdaştırıcı bilgileri güncellemeleri

Kullanıcı chrome://flags/#enable-webgpu-developer-features adresinde "WebGPU Geliştirici Özellikleri" işaretini etkinleştirdiğinde, requestAdapterInfo() çağrısı yapıldığında standart olmayan type ve backend bağdaştırıcı bilgisi özellikleri artık kullanılabilir. type; "ayrı GPU", "entegre GPU", "CPU" veya "bilinmiyor" olabilir. backend; "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" veya "null" olur. issue sawn:2112 ve issue sawn:2107 bölümlerine bakın.

https://webgpureport.org adresinin arka ucu gösteren ve bağdaştırıcı bilgilerini içeren ekran görüntüsü.
Bağdaştırıcı bilgileri arka ucu ve türü https://webgpureport.org sayfasında gösterilmiştir.

requestAdapterInfo() işlevindeki isteğe bağlı unmaskHints liste parametresi kaldırıldı. issue dawn:1427'yi inceleyin.

Zaman damgası sorgularının nicelenmesi

Zaman damgası sorguları, uygulamaların GPU komutlarının yürütme süresini nanosaniye hassasiyetle ölçmesini sağlar. Ancak WebGPU spesifikasyonu, zamanlama saldırısı sorunları nedeniyle zaman damgası sorgularını isteğe bağlı hale getirir. Chrome ekibi, zaman damgası sorgularının hesaplanmasının, çözünürlüğü 100 mikrosaniyeye düşürerek hassasiyet ile güvenlik arasında iyi bir uzlaşma sağladığına inanmaktadır. issue dawn:1800'e bakın.

Kullanıcılar Chrome'da chrome://flags/#enable-webgpu-developer-features konumundaki "WebGPU Geliştirici Özellikleri" işaretini etkinleştirerek zaman damgasını ölçmeyi devre dışı bırakabilir. Yalnızca bu işaretin "timestamp-query" özelliğini etkinleştirmediğini unutmayın. Bu özelliğin uygulanması hâlâ deneme aşamasındadır ve bu nedenle chrome://flags/#enable-unsafe-webgpu konumunda "Güvenli Olmayan WebGPU Desteği" işaretini gerektirir.

Dawn'da "timestamp_quantization" adlı yeni bir cihaz açma/kapatma özelliği eklendi ve varsayılan olarak etkinleştirildi. Aşağıdaki snippet'te, bir cihaz istenirken zaman damgası ölçümü olmadan deneysel "zaman damgası sorgusu" özelliğine nasıl izin verileceği gösterilmektedir.

wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};

const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;

const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = &timestampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;

wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};

// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);

İlkbahar temizliği özellikleri

Deneysel "timestamp-query-inside-passes" özelliğinin adı "chromium-experimental-timestamp-query-inside-passes" ise geliştiricilere bu özelliğin deneysel bir çalışma olduğunu ve şimdilik yalnızca Chromium tabanlı tarayıcılarda kullanılabileceğini göstermek amacıyla yeni bir ad verilmiştir. issue dawn:1193'e bakın.

Yalnızca kısmen uygulanan deneysel "ardışık düzen-istatistik-sorgu" özelliği artık geliştirilmediğinden kaldırıldı. chromium:1177506 sorunu bölümüne bakın.

Burada, öne çıkan özelliklerin yalnızca bir kısmı ele alınıyor. Kayıtların kapsamlı listesine göz atın.

WebGPU'daki Yenilikler

WebGPU'daki Yenilikler serisinde ele alınan her şeyin listesi.

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113