Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
Trong WGSL, loại f16
là tập hợp các giá trị dấu phẩy động 16 bit ở định dạng IEEE-754 binary16 (nửa độ chính xác). Điều này có nghĩa là mã này sử dụng 16 bit để biểu diễn số dấu phẩy động, thay vì 32 bit cho dấu phẩy động có độ chính xác đơn thông thường (f32
). Kích thước nhỏ hơn này có thể dẫn đến những cải thiện đáng kể về hiệu suất, đặc biệt là khi xử lý một lượng lớn dữ liệu.
Để so sánh, trên thiết bị Apple M1 Pro, việc triển khai f16
mẫu Llama2 7B dùng trong bản minh hoạ trò chuyện WebLLM nhanh hơn đáng kể so với f32
, với tốc độ điền sẵn tăng 28% và tốc độ giải mã tăng 41%, như minh hoạ trong ảnh chụp màn hình sau.
Không phải GPU nào cũng hỗ trợ giá trị dấu phẩy động 16 bit. Giờ đây, khi tính năng "shader-f16"
có trong GPUAdapter
, bạn có thể yêu cầu GPUDevice
cho tính năng này và tạo mô-đun chương trình đổ bóng WGSL tận dụng loại dấu phẩy động có độ bán chính xác f16
. Kiểu này chỉ hợp lệ để sử dụng trong mô-đun chương trình đổ bóng WGSL nếu bạn bật tiện ích WGSL f16
bằng enable f16;
. Nếu không, createShaderModule() sẽ tạo ra lỗi xác thực. Hãy xem ví dụ tối thiểu sau và Vấn đề bình minh:1510.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("shader-f16")) {
throw new Error("16-bit floating-point value support is not available");
}
// Explicitly request 16-bit floating-point value support.
const device = await adapter.requestDevice({
requiredFeatures: ["shader-f16"],
});
const code = `
enable f16;
@compute @workgroup_size(1)
fn main() {
const c : vec3h = vec3<f16>(1.0h, 2.0h, 3.0h);
}
`;
const shaderModule = device.createShaderModule({ code });
// Create a compute pipeline with this shader module
// and run the shader on the GPU...
Bạn có thể hỗ trợ cả hai loại f16
và f32
trong mã mô-đun chương trình đổ bóng WGSL với một alias
tuỳ thuộc vào khả năng hỗ trợ tính năng "shader-f16"
như minh hoạ trong đoạn mã sau.
const adapter = await navigator.gpu.requestAdapter();
const hasShaderF16 = adapter.features.has("shader-f16");
const device = await adapter.requestDevice({
requiredFeatures: hasShaderF16 ? ["shader-f16"] : [],
});
const header = hasShaderF16
? `enable f16;
alias min16float = f16;`
: `alias min16float = f32;`;
const code = `
${header}
@compute @workgroup_size(1)
fn main() {
const c = vec3<min16float>(1.0, 2.0, 3.0);
}
`;
Phá vỡ giới hạn
Theo mặc định, số byte tối đa cần thiết để lưu giữ một mẫu (pixel hoặc pixel con) của dữ liệu đầu ra của quy trình kết xuất trên tất cả các tệp đính kèm màu là 32 byte. Giờ đây, bạn có thể yêu cầu lên đến 64 bằng cách sử dụng hạn mức maxColorAttachmentBytesPerSample
. Hãy xem ví dụ sau và vấn đề bình minh:2036.
const adapter = await navigator.gpu.requestAdapter();
if (adapter.limits.maxColorAttachmentBytesPerSample < 64) {
// When the desired limit isn't supported, take action to either fall back to
// a code path that does not require the higher limit or notify the user that
// their device does not meet minimum requirements.
}
// Request highest limit of max color attachments bytes per sample.
const device = await adapter.requestDevice({
requiredLimits: { maxColorAttachmentBytesPerSample: 64 },
});
Giới hạn maxInterStageShaderVariables
và maxInterStageShaderComponents
dùng cho hoạt động giao tiếp giữa các giai đoạn đã được tăng lên trên tất cả các nền tảng. Hãy xem mục Vấn đề bình minh:1448 để biết thông tin chi tiết.
Đối với mỗi giai đoạn của chương trình đổ bóng, theo mặc định, số lượng mục nhập bố cục nhóm liên kết tối đa trên một bố cục quy trình (là vùng đệm lưu trữ) là 8. Giờ đây, bạn có thể yêu cầu lên đến 10 yêu cầu bằng cách sử dụng hạn mức maxStorageBuffersPerShaderStage
. Hãy xem mục Vấn đề bình minh:2159.
Đã thêm hạn mức maxBindGroupsPlusVertexBuffers
mới. Giao diện này bao gồm số khe nhóm liên kết và khe đệm đỉnh tối đa được sử dụng đồng thời, đếm bất kỳ khe trống nào bên dưới chỉ mục cao nhất. Giá trị mặc định của nó là 24. Xem Vấn đề bình minh:năm 1849.
Thay đổi trạng thái khuôn mẫu theo chiều sâu
Để cải thiện trải nghiệm của nhà phát triển, các thuộc tính trạng thái chiều sâu depthWriteEnabled
và depthCompare
không phải lúc nào cũng cần thiết nữa: depthWriteEnabled
chỉ bắt buộc cho các định dạng có chiều sâu và depthCompare
không bắt buộc cho các định dạng có chiều sâu nếu không được sử dụng. Hãy xem mục Vấn đề bình minh:2132.
Cập nhật thông tin về bộ chuyển đổi
Các thuộc tính thông tin về bộ chuyển đổi type
và backend
không chuẩn hiện đã có sẵn khi gọi requestAdapterInfo() khi người dùng bật cờ "Các tính năng dành cho nhà phát triển WebGPU" tại chrome://flags/#enable-webgpu-developer-features
. type
có thể là "GPU rời", "GPU tích hợp", "CPU" hoặc "không xác định". backend
là "WebGPU", "D3D11", "D3D12", "metal", "vulkan", "openGL", "openGLES" hoặc "null". Hãy xem Vấn đề bình minh:2112 và Bình minh của vấn đề:2107.
Tham số danh sách unmaskHints
không bắt buộc trong requestAdapterInfo() đã bị xoá. Xem nội dung Vấn đề bình minh:1427.
Số lượng truy vấn dấu thời gian
Truy vấn dấu thời gian cho phép các ứng dụng đo lường thời gian thực thi các lệnh GPU với độ chính xác nano giây. Tuy nhiên, thông số kỹ thuật WebGPU khiến các truy vấn dấu thời gian là không bắt buộc do vấn đề về tấn công thời gian. Nhóm Chrome tin rằng việc lượng tử hoá các truy vấn dấu thời gian sẽ mang lại sự thoả đáng giữa độ chính xác và tính bảo mật, bằng cách giảm độ phân giải xuống còn 100 micrô giây. Xem Vấn đề bình minh:1800.
Trong Chrome, người dùng có thể tắt tính năng lượng tử dấu thời gian bằng cách bật cờ "Các tính năng dành cho nhà phát triển WebP" tại chrome://flags/#enable-webgpu-developer-features
. Xin lưu ý rằng chỉ riêng cờ này thì không được bật tính năng "timestamp-query"
. Quá trình triển khai tính năng này vẫn đang trong quá trình thử nghiệm nên yêu cầu phải có cờ "Hỗ trợ WebGPU không an toàn" tại chrome://flags/#enable-unsafe-webgpu
.
Trong Dawn, một nút bật/tắt thiết bị mới có tên là "timestamp_quantization" đã được thêm vào và được bật theo mặc định. Đoạn mã sau đây hướng dẫn bạn cách cho phép tính năng "truy vấn dấu thời gian" thử nghiệm mà không cần lượng tử hoá dấu thời gian khi yêu cầu một thiết bị.
wgpu::DawnTogglesDescriptor deviceTogglesDesc = {};
const char* allowUnsafeApisToggle = "allow_unsafe_apis";
deviceTogglesDesc.enabledToggles = &allowUnsafeApisToggle;
deviceTogglesDesc.enabledToggleCount = 1;
const char* timestampQuantizationToggle = "timestamp_quantization";
deviceTogglesDesc.disabledToggles = ×tampQuantizationToggle;
deviceTogglesDesc.disabledToggleCount = 1;
wgpu::DeviceDescriptor desc = {.nextInChain = &deviceTogglesDesc};
// Request a device with no timestamp quantization.
myAdapter.RequestDevice(&desc, myCallback, myUserData);
Tính năng vệ sinh lò xo
Tính năng thử nghiệm "timestamp-query-inside-passes" đã được đổi tên thành "chromium-experimental-timestamp-query-inside-passes" để giúp các nhà phát triển hiểu rõ rằng tính năng này hiện đang ở giai đoạn thử nghiệm và hiện chỉ có trong các trình duyệt dựa trên Chromium. Hãy xem mục Vấn đề bình minh:1193.
Tính năng "pipeline-statistics-query" thử nghiệm (chỉ mới được triển khai một phần) đã bị xoá vì không còn được phát triển nữa. Xem phần vấn đề chromium:1177506.
Bài viết này chỉ bao gồm một số điểm nổi bật chính. Xem danh sách đầy đủ các thay đổi.
Tính năng mới trong WebGPU
Danh sách tất cả nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.
Chrome 125
- Nhóm con (tính năng đang trong quá trình phát triển)
- Kết xuất thành lát của hoạ tiết 3D
- Thông tin cập nhật từ Bình minh
Chrome 124
- Kết cấu bộ nhớ chỉ đọc và đọc-ghi
- Hỗ trợ trình chạy dịch vụ và trình thực thi dùng chung
- Các thuộc tính mới về thông tin bộ chuyển đổi
- Sửa lỗi
- Thông tin cập nhật từ Bình minh
Chrome 123
- Hỗ trợ các hàm tích hợp DP4a trong WGSL
- Tham số con trỏ không bị hạn chế trong WGSL
- Đường cú pháp để loại bỏ thuộc tính tổng hợp trong WGSL
- Tách riêng trạng thái chỉ đọc cho khung viền và chiều sâu
- Thông tin cập nhật từ Bình minh
Chrome 122
- Mở rộng phạm vi tiếp cận bằng chế độ tương thích (tính năng đang trong quá trình phát triển)
- Tăng giới hạn maxVertexAttributes
- Thông tin cập nhật từ Bình minh
Chrome 121
- Hỗ trợ WebGPU trên Android
- Sử dụng DXC thay vì FXC để biên dịch chương trình đổ bóng trên Windows
- Truy vấn dấu thời gian trong thẻ điện toán và kết xuất
- Điểm truy cập mặc định đến mô-đun chương trình đổ bóng
- Hỗ trợ display-p3 dưới dạng hệ màu GPUExternalTexture
- Thông tin về vùng nhớ khối xếp
- Thông tin cập nhật từ Bình minh
Chrome 120
- Hỗ trợ các giá trị dấu phẩy động 16 bit trong WGSL
- Vượt giới hạn
- Thay đổi trạng thái khuôn khổ sâu
- Cập nhật thông tin về bộ chuyển đổi
- Số lượng truy vấn dấu thời gian
- Tính năng vệ sinh lò xo
Chrome 119
- Hoạ tiết nổi 32 bit có thể lọc
- định dạng đỉnh unorm10-10-10-2
- định dạng hoạ tiết rgb10a2uint
- Thông tin cập nhật từ Bình minh
Chrome 118
- Hỗ trợ HTMLImageElement và ImageData trong
copyExternalImageToTexture()
- Hỗ trợ thử nghiệm cho hoạ tiết lưu trữ chỉ đọc và ghi
- Thông tin cập nhật từ Bình minh
Chrome 117
- Huỷ thiết lập vùng đệm đỉnh
- Huỷ thiết lập nhóm liên kết
- Tắt tiếng lỗi trong quá trình tạo quy trình không đồng bộ khi thiết bị bị mất
- Thông tin cập nhật về việc tạo mô-đun chương trình đổ bóng SPIR-V
- Cải thiện trải nghiệm của nhà phát triển
- Quy trình lưu vào bộ nhớ đệm với bố cục được tạo tự động
- Thông tin cập nhật từ Bình minh
Chrome 116
- Tích hợp WebCodecs
- Thiết bị bị mất được GPUAdapter trả về
requestDevice()
- Duy trì quá trình phát video mượt mà nếu
importExternalTexture()
được gọi - Tuân thủ thông số kỹ thuật
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật từ Bình minh
Chrome 115
- Các phần mở rộng ngôn ngữ WGSL được hỗ trợ
- Hỗ trợ thử nghiệm cho Direct3D 11
- Nhận GPU rời theo mặc định khi dùng nguồn điện xoay chiều
- Cải thiện trải nghiệm của nhà phát triển
- Thông tin cập nhật từ Bình minh
Chrome 114
- Tối ưu hoá JavaScript
- getCurrentTexture() trên canvas chưa được định cấu hình sẽ gửi InvalidStateError
- Thông tin cập nhật về WGSL
- Thông tin cập nhật từ Bình minh