Yang Baru di WebGPU (Chrome\r120)

François Beaufort
François Beaufort

Dukungan untuk nilai floating point 16-bit dalam WGSL

Dalam WGSL, jenis f16 adalah kumpulan nilai floating point 16 bit dari format IEEE-754 biner16 (presisi setengah). Ini berarti penggunaan 16 bit untuk merepresentasikan angka floating point, berbeda dengan 32 bit untuk floating point presisi tunggal konvensional (f32). Ukuran yang lebih kecil ini dapat menyebabkan peningkatan performa yang signifikan, terutama saat memproses data dalam jumlah besar.

Sebagai perbandingan, pada perangkat Apple M1 Pro, penerapan f16 model Llama2 7B yang digunakan dalam demo chat WebLLM jauh lebih cepat daripada implementasi f32, dengan peningkatan kecepatan pengisian otomatis sebesar 28% dan peningkatan kecepatan decoding sebesar 41% seperti yang ditunjukkan dalam screenshot berikut.

Screenshot demo obrolan WebLLM dengan model Llama2 7B f32 dan f16.
Demo chat WebLLM dengan model f32 (kiri) dan f16 (kanan) Llama2 7B.

Tidak semua GPU mendukung nilai floating point 16 bit. Jika fitur "shader-f16" tersedia di GPUAdapter, Anda kini dapat meminta GPUDevice dengan fitur ini dan membuat modul shader WGSL yang memanfaatkan jenis floating point presisi setengah f16. Jenis ini hanya valid untuk digunakan dalam modul shader WGSL hanya jika Anda mengaktifkan ekstensi WGSL f16 dengan enable f16;. Jika tidak, createShaderModule() akan menghasilkan error validasi. Lihat contoh minimal berikut dan issue dawn:1510.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
  throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
  requiredFeatures: ["shader-f16"],
});

const code = `
  enable f16;

  @compute @workgroup_size(1)
  fn main() {
    const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
  }
`;

const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...

Anda dapat mendukung jenis f16 dan f32 dalam kode modul shader WGSL dengan alias bergantung pada dukungan fitur "shader-f16" seperti yang ditunjukkan dalam cuplikan berikut.

const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");

const device = await adapter.requestDevice({
  requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});

const header = hasShaderF16
  ? `enable f16;
     alias min16float = f16;`
  : `alias min16float = f32;`;

const code = `
  ${header}

  @compute @workgroup_size(1)
  fn main() {
    const c = vec3<min16float>(1.0, 2.0, 3.0);
  }
`;

Lampaui batas

Jumlah maksimum byte yang diperlukan untuk menyimpan satu sampel (piksel atau subpiksel) data output pipeline render, di semua lampiran warna, secara default adalah 32 byte. Sekarang Anda dapat meminta hingga 64 kode menggunakan batas maxColorAttachmentBytesPerSample. Lihat contoh dan masalah fajar:2036 berikut.

const adapter = await navigator.gpu.requestAdapter();

if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
  // When the desired limit isn't supported, take action to either fall back to
  // a code path that does not require the higher limit or notify the user that
  // their device does not meet minimum requirements.
}

// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
  requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});

Batas maxInterStageShaderVariables dan maxInterStageShaderComponents yang digunakan untuk komunikasi antar-tahap telah ditingkatkan di semua platform. Lihat masalah dawn:1448 untuk mengetahui detailnya.

Untuk setiap stage shader, jumlah maksimum entri tata letak bind group di seluruh tata letak pipeline yang merupakan buffer penyimpanan adalah 8 secara default. Sekarang Anda dapat meminta hingga 10 file menggunakan batas maxStorageBuffersPerShaderStage. Lihat masalah dawn:2159.

Batas maxBindGroupsPlusVertexBuffers baru telah ditambahkan. Ini terdiri dari jumlah maksimum slot bind group dan buffer verteks yang digunakan secara bersamaan, menghitung slot kosong di bawah indeks tertinggi. Nilai defaultnya adalah 24. Lihat masalah dawn:1849.

Perubahan pada status stensil kedalaman

Untuk meningkatkan pengalaman developer, atribut status stensil depthWriteEnabled dan depthCompare tidak selalu diperlukan lagi: depthWriteEnabled hanya diperlukan untuk format dengan kedalaman, dan depthCompare tidak diperlukan untuk format dengan kedalaman jika tidak digunakan sama sekali. Lihat masalah fawn:2132.

Pembaruan informasi adaptor

Atribut info adaptor type dan backend non-standar kini tersedia setelah memanggil requestAdapterInfo() jika pengguna telah mengaktifkan tanda "WebGPU Developer Features" di chrome://flags/#enable-webgpu-developer-features. type dapat berupa "GPU terpisah", "GPU terintegrasi", "CPU", atau "tidak diketahui". backend dapat berupa "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES", atau "null". Lihat masalah dawn:2112 dan issue dawn:2107.

Screenshot https://webgpureport.org yang menampilkan backend dan jenis info adaptor.
Jenis dan backend info adaptor ditampilkan di https://webgpureport.org.

Parameter daftar unmaskHints opsional di requestAdapterInfo() telah dihapus. Lihat masalah fawn:1427.

Kuantisasi kueri stempel waktu

Kueri stempel waktu memungkinkan aplikasi mengukur waktu eksekusi perintah GPU dengan presisi nanodetik. Namun, spesifikasi WebGPU menjadikan kueri stempel waktu bersifat opsional karena masalah serangan waktu. Tim Chrome yakin bahwa mengkuantisasi kueri stempel waktu memberikan kompromi yang baik antara presisi dan keamanan, dengan mengurangi resolusi hingga 100 mikrodetik. Lihat masalah dawn:1800.

Di Chrome, pengguna dapat menonaktifkan kuantisasi stempel waktu dengan mengaktifkan tanda "Fitur Developer WebGPU" di chrome://flags/#enable-webgpu-developer-features. Perhatikan bahwa hanya tanda ini saja tidak mengaktifkan fitur "timestamp-query". Implementasinya masih bersifat eksperimental sehingga memerlukan flag "Unsafe WebGPU Support" di chrome://flags/#enable-unsafe-webgpu.

Di Fajar, tombol alih perangkat baru yang disebut "timestamp_quantization" telah ditambahkan dan diaktifkan secara default. Cuplikan berikut menunjukkan cara mengizinkan fitur "kueri-stempel waktu" eksperimental tanpa kuantisasi stempel waktu saat meminta perangkat.

wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};

const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;

const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = &timestampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;

wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};

// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);

Fitur bersih-bersih

Fitur eksperimental "timestamp-query-inside-passes" telah diganti namanya menjadi "chromium-experimental-timestamp-query-inside-passes" untuk menjelaskan kepada developer bahwa fitur ini bersifat eksperimental dan hanya tersedia di browser berbasis Chromium untuk saat ini. Lihat masalah dawn:1193.

Fitur eksperimental "pipeline-statistics-query", yang hanya diterapkan sebagian, telah dihapus karena tidak lagi dikembangkan. Lihat masalah chromium:1177506.

Artikel ini hanya mencakup beberapa sorotan utama. Lihat daftar lengkap commit.

Yang Baru di WebGPU

Daftar semua hal yang tercakup dalam seri What's New in WebGPU.

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113