Dukungan untuk nilai floating point 16-bit di WGSL
Di WGSL, jenis f16
adalah kumpulan nilai floating point 16-bit dari format binary16 (presisi setengah) IEEE-754. Artinya, floating point presisi tunggal menggunakan 16 bit untuk merepresentasikan bilangan floating point, bukan 32 bit untuk floating point presisi tunggal konvensional (f32
). Ukuran yang lebih kecil ini dapat menghasilkan peningkatan performa yang signifikan, terutama saat memproses data dalam jumlah besar.
Sebagai perbandingan, pada perangkat Apple M1 Pro, penerapan f16
model Llama2 7B yang digunakan dalam demo chat WebLLM jauh lebih cepat daripada penerapan f32
, dengan peningkatan kecepatan pra-isi sebesar 28% dan peningkatan kecepatan decoding sebesar 41% seperti yang ditunjukkan dalam screenshot berikut.
Tidak semua GPU mendukung nilai floating point 16-bit. Saat fitur "shader-f16"
tersedia di GPUAdapter
, Anda kini dapat meminta GPUDevice
dengan fitur ini dan membuat modul shader WGSL yang memanfaatkan jenis floating point presisi setengah f16
. Jenis ini valid untuk digunakan dalam modul shader WGSL hanya jika Anda mengaktifkan ekstensi WGSL f16
dengan enable f16;
. Jika tidak, createShaderModule() akan menghasilkan error validasi. Lihat contoh minimal berikut dan masalah dawn:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
Anda dapat mendukung jenis f16
dan f32
dalam kode modul shader WGSL dengan alias
bergantung pada dukungan fitur "shader-f16"
seperti yang ditunjukkan dalam cuplikan berikut.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Mendorong batas
Jumlah maksimum byte yang diperlukan untuk menyimpan satu sampel (piksel atau subpiksel) data output pipeline render, di semua lampiran warna, adalah 32 byte secara default. Sekarang Anda dapat meminta hingga 64 menggunakan batas maxColorAttachmentBytesPerSample
. Lihat contoh berikut dan issue dawn:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Batas maxInterStageShaderVariables
dan maxInterStageShaderComponents
yang digunakan untuk komunikasi antar-tahap telah ditingkatkan di semua platform. Lihat masalah dawn:1448 untuk mengetahui detailnya.
Untuk setiap tahap shader, jumlah maksimum entri tata letak grup pengikatan di seluruh tata letak pipeline yang merupakan buffering penyimpanan adalah 8 secara default. Sekarang Anda dapat meminta hingga 10 menggunakan batas maxStorageBuffersPerShaderStage
. Lihat masalah dawn:2159.
Batas maxBindGroupsPlusVertexBuffers
baru telah ditambahkan. Ini terdiri dari jumlah maksimum slot buffer vertex dan grup pengikatan yang digunakan secara bersamaan, dengan menghitung slot kosong di bawah indeks tertinggi. Nilai defaultnya adalah 24. Lihat masalah dawn:1849.
Perubahan pada status depth-stensil
Untuk meningkatkan pengalaman developer, atribut status depth-stensil depthWriteEnabled
dan depthCompare
tidak selalu diperlukan lagi: depthWriteEnabled
hanya diperlukan untuk format dengan kedalaman, dan depthCompare
tidak diperlukan untuk format dengan kedalaman jika tidak digunakan sama sekali. Lihat masalah dawn:2132.
Pembaruan informasi adaptor
Atribut info adaptor type
dan backend
non-standar kini tersedia setelah memanggil requestAdapterInfo() saat pengguna telah mengaktifkan flag "Fitur Developer WebGPU" di chrome://flags/#enable-webgpu-developer-features
. type
dapat berupa "GPU terpisah", "GPU terintegrasi", "CPU", atau "tidak diketahui". backend
adalah "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES", atau "null". Lihat masalah dawn:2112 dan masalah dawn:2107.
Parameter daftar unmaskHints
opsional di requestAdapterInfo() telah dihapus. Lihat masalah dawn:1427.
Kuantisasi kueri stempel waktu
Kueri stempel waktu memungkinkan aplikasi mengukur waktu eksekusi perintah GPU dengan presisi nanodetik. Namun, spesifikasi WebGPU membuat kueri stempel waktu bersifat opsional karena adanya masalah serangan pengaturan waktu. Tim Chrome yakin bahwa kuantisasi kueri stempel waktu memberikan kompromi yang baik antara presisi dan keamanan, dengan mengurangi resolusi menjadi 100 mikrodetik. Lihat issue dawn:1800.
Di Chrome, pengguna dapat menonaktifkan kuantisasi stempel waktu dengan mengaktifkan flag "Fitur Developer WebGPU" di chrome://flags/#enable-webgpu-developer-features
. Perhatikan bahwa flag ini saja tidak mengaktifkan fitur "timestamp-query"
. Implementasinya masih bersifat eksperimental dan oleh karena itu memerlukan tanda "Dukungan WebGPU Tidak Aman" di chrome://flags/#enable-unsafe-webgpu
.
Di Dawn, tombol perangkat baru yang disebut "timestamp_quantization" telah ditambahkan dan diaktifkan secara default. Cuplikan berikut menunjukkan cara mengizinkan fitur "kueri stempel waktu" eksperimental tanpa kuantisasi stempel waktu saat meminta perangkat.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Fitur pembersihan musim semi
Fitur "timestamp-query-inside-passes" eksperimental telah diganti namanya menjadi "chromium-experimental-timestamp-query-inside-passes" untuk memperjelas kepada developer bahwa fitur ini bersifat eksperimental dan hanya tersedia di browser berbasis Chromium untuk saat ini. Lihat masalah dawn:1193.
Fitur "pipeline-statistics-query" eksperimental, yang hanya diterapkan sebagian, telah dihapus karena tidak lagi dikembangkan. Lihat masalah chromium:1177506.
Bagian ini hanya membahas beberapa sorotan utama. Lihat daftar commit yang lengkap.
Yang Baru di WebGPU
Daftar semua yang telah dibahas dalam seri Yang Baru di WebGPU.
Chrome 131
- Memotong jarak di WGSL
- GPUCanvasContext getConfiguration()
- Primitif titik dan garis tidak boleh memiliki bias kedalaman
- Fungsi bawaan pemindaian inklusif untuk subgrup
- Dukungan eksperimental untuk multi-gambar tidak langsung
- Opsi kompilasi modul shader matematika ketat
- Menghapus GPUAdapter requestAdapterInfo()
- Info terbaru fajar
Chrome 130
- Penggabungan sumber ganda
- Peningkatan waktu kompilasi shader di Metal
- Penghentian penggunaan requestAdapterInfo() GPUAdapter
- Pembaruan Dawn
Chrome 129
Chrome 128
- Bereksperimen dengan subgrup
- Penghentian penggunaan setelan bias kedalaman untuk garis dan titik
- Menyembunyikan peringatan error DevTools yang tidak direkam jika preventDefault
- WGSL melakukan interpolasi sampling terlebih dahulu dan
- Pembaruan Dawn
Chrome 127
- Dukungan eksperimental untuk OpenGL ES di Android
- Atribut info GPUAdapter
- Peningkatan interop WebAssembly
- Memperbaiki error encoder perintah
- Pembaruan Dawn
Chrome 126
- Meningkatkan batas maxTextureArrayLayers
- Pengoptimalan upload buffering untuk backend Vulkan
- Peningkatan waktu kompilasi shader
- Buffer perintah yang dikirimkan harus unik
- Pembaruan Dawn
Chrome 125
Chrome 124
- Tekstur penyimpanan hanya baca dan baca-tulis
- Dukungan pekerja layanan dan pekerja bersama
- Atribut informasi adaptor baru
- Perbaikan bug
- Pembaruan Dawn
Chrome 123
- Dukungan fungsi bawaan DP4a di WGSL
- Parameter pointer yang tidak dibatasi di WGSL
- Sintaksis yang lebih mudah untuk mendereferensikan komposit di WGSL
- Status hanya baca terpisah untuk aspek stencil dan kedalaman
- Pembaruan Dawn
Chrome 122
- Memperluas jangkauan dengan mode kompatibilitas (fitur dalam pengembangan)
- Meningkatkan batas maxVertexAttributes
- Pembaruan Dawn
Chrome 121
- Mendukung WebGPU di Android
- Menggunakan DXC, bukan FXC, untuk kompilasi shader di Windows
- Kueri stempel waktu dalam penerusan komputasi dan rendering
- Titik entri default ke modul shader
- Mendukung display-p3 sebagai ruang warna GPUExternalTexture
- Info heap memori
- Pembaruan Dawn
Chrome 120
- Dukungan untuk nilai floating point 16-bit di WGSL
- Mendorong batas
- Perubahan pada status kedalaman-stensil
- Pembaruan informasi adaptor
- Kuantisasi kueri stempel waktu
- Fitur pembersihan musim semi
Chrome 119
- Tekstur float 32-bit yang dapat difilter
- Format verteks unorm10-10-10-2
- Format tekstur rgb10a2uint
- Pembaruan Dawn
Chrome 118
- Dukungan HTMLImageElement dan ImageData di
copyExternalImageToTexture()
- Dukungan eksperimental untuk tekstur penyimpanan baca-tulis dan hanya baca
- Pembaruan Dawn
Chrome 117
- Membatalkan penetapan buffer verteks
- Membatalkan penetapan bind group
- Menyembunyikan error dari pembuatan pipeline asinkron saat perangkat hilang
- Pembaruan pembuatan modul shader SPIR-V
- Meningkatkan pengalaman developer
- Menyimpan cache pipeline dengan tata letak yang dibuat secara otomatis
- Pembaruan Dawn
Chrome 116
- Integrasi WebCodecs
- Perangkat hilang yang ditampilkan oleh GPUAdapter
requestDevice()
- Membuat pemutaran video tetap lancar jika
importExternalTexture()
dipanggil - Kepatuhan spesifikasi
- Meningkatkan pengalaman developer
- Pembaruan Dawn
Chrome 115
- Ekstensi bahasa WGSL yang didukung
- Dukungan eksperimental untuk Direct3D 11
- Mendapatkan GPU diskret secara default menggunakan daya AC
- Meningkatkan pengalaman developer
- Pembaruan Dawn
Chrome 114
- Optimize JavaScript
- getCurrentTexture() pada kanvas yang tidak dikonfigurasi akan menampilkan InvalidStateError
- Update WGSL
- Info terbaru fajar