Tính năng mới trong WebGPU (Chrome'123)

François Beaufort
François Beaufort

Hỗ trợ các chức năng tích hợp DP4a trong WGSL

DP4a (Sản phẩm chấm của 4 phần tử và Tích luỹ) đề cập đến một tập hợp các lệnh về GPU thường được dùng trong suy luận học sâu để lượng tử hoá. Công cụ này thực hiện hiệu quả các sản phẩm có số nguyên 8 bit để tăng tốc việc tính toán các mô hình lượng tử hoá int8 như vậy. Nó có thể tiết kiệm (lên đến 75%) bộ nhớ và băng thông mạng, đồng thời cải thiện hiệu suất của bất kỳ mô hình học máy nào trong việc dự đoán so với phiên bản f32. Vì vậy, công nghệ này hiện được sử dụng rất nhiều trong nhiều khung AI phổ biến.

Khi phần mở rộng ngôn ngữ "packed_4x8_integer_dot_product" WGSL có trong navigator.gpu.wgslLanguageFeatures, bạn hiện có thể sử dụng các đại lượng vô hướng số nguyên 32 bit đóng gói các vectơ 4 thành phần của số nguyên 8 bit làm dữ liệu đầu vào cho các lệnh cho sản phẩm dấu chấm trong mã chương trình đổ bóng WGSL bằng các hàm tích hợp dot4U8Packeddot4I8Packed. Bạn cũng có thể sử dụng hướng dẫn đóng gói và giải nén bằng vectơ 4 thành phần đóng gói của số nguyên 8 bit với các hàm tích hợp sẵn pack4xI8, pack4xU8, pack4xI8Clamp, pack4xU8Clamp, unpack4xI8unpack4xU8 WGSL.

Bạn nên sử dụng lệnh yêu cầu để báo hiệu khả năng không di chuyển được bằng requires packed_4x8_integer_dot_product; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau đây và Vấn đề tông màu:1497.

if (!navigator.gpu.wgslLanguageFeatures.has("packed_4x8_integer_dot_product")) {
  throw new Error(`DP4a built-in functions are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires packed_4x8_integer_dot_product;

  fn main() {
    const result: u32 = dot4U8Packed(0x01020304u, 0x02040405u); // 42
  }`,
});

Đặc biệt cảm ơn nhóm Đồ hoạ web của Intel tại Thượng Hải vì đã hoàn thiện bản đặc tả kỹ thuật và triển khai này!

Tham số con trỏ không bị hạn chế trong WGSL

Phần mở rộng ngôn ngữ "unrestricted_pointer_parameters" của WGSL nới lỏng các hạn chế về việc con trỏ có thể được truyền đến các hàm WGSL:

  • Con trỏ tham số của không gian địa chỉ storage, uniformworkgroup đến các hàm do người dùng khai báo.

  • Truyền con trỏ đến các thành phần cấu trúc và phần tử mảng đến các hàm do người dùng khai báo.

Xem bài viết Con trỏ dưới dạng tham số hàm | Tìm hiểu về WGSL để tìm hiểu thêm.

Bạn có thể phát hiện tính năng này bằng navigator.gpu.wgslLanguageFeatures. Bạn nên luôn sử dụng lệnh yêu cầu để báo hiệu khả năng không di chuyển được bằng requires unrestricted_pointer_parameters; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau: Thay đổi thông số WGSLsắc thái màu: 2053.

if (!navigator.gpu.wgslLanguageFeatures.has("unrestricted_pointer_parameters")) {
  throw new Error(`Unrestricted pointer parameters are not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires unrestricted_pointer_parameters;

  @group(0) @binding(0) var<storage, read_write> S : i32;

  fn func(pointer : ptr<storage, i32, read_write>) {
    *pointer = 42;
  }

  @compute @workgroup_size(1)
  fn main() {
    func(&S);
  }`
});

Đường cú pháp để vô hiệu hoá thuộc tính tổng hợp trong WGSL

Khi phần mở rộng ngôn ngữ "pointer_composite_access" WGSL có trong navigator.gpu.wgslLanguageFeatures, mã chương trình đổ bóng WGSL của bạn hiện hỗ trợ quyền truy cập vào các thành phần của các kiểu dữ liệu phức tạp bằng cách sử dụng cùng cú pháp dấu chấm (.) cho dù bạn đang làm việc trực tiếp với dữ liệu hay bằng con trỏ tới dữ liệu đó. Cách hoạt động như sau:

  • Nếu foo là một con trỏ: foo.bar là cách thuận tiện hơn để ghi (*foo).bar. Dấu hoa thị (*) thông thường cần thiết để biến con trỏ thành "tham chiếu" có thể được tham chiếu đến, nhưng giờ đây cả con trỏ và tham chiếu đều giống nhau và gần như có thể thay thế cho nhau.

  • Nếu foo không phải là con trỏ: Toán tử dấu chấm (.) sẽ hoạt động chính xác như cách bạn thường dùng để truy cập trực tiếp vào các thành viên.

Tương tự, nếu pa là một con trỏ lưu trữ địa chỉ bắt đầu của một mảng, thì việc sử dụng pa[i] sẽ cho phép bạn truy cập trực tiếp vào vị trí bộ nhớ nơi lưu trữ phần tử thứ 'i của mảng đó.

Bạn nên sử dụng lệnh yêu cầu để báo hiệu khả năng không di chuyển được bằng requires pointer_composite_access; ở đầu mã chương trình đổ bóng WGSL. Hãy xem ví dụ sau đây và trang màu của lỗi:2113.

if (!navigator.gpu.wgslLanguageFeatures.has("pointer_composite_access")) {
  throw new Error(`Pointer composite access is not available`);
}

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

const shaderModule = device.createShaderModule({ code: `
  requires pointer_composite_access;

  fn main() {
    var a = vec3f();
    let p : ptr<function, vec3f> = &a;
    let r1 = (*p).x; // always valid.
    let r2 = p.x; // requires pointer composite access.
  }`
});

Riêng biệt trạng thái chỉ đọc cho khía cạnh khuôn tô và chiều sâu

Trước đây, các tệp đính kèm chiều sâu chỉ đọc trong lượt kết xuất yêu cầu cả hai khía cạnh (độ sâu và khuôn tô) đều phải ở chế độ chỉ đọc. Giới hạn này đã được gỡ bỏ. Giờ đây, bạn có thể sử dụng thành phần chiều sâu ở chế độ chỉ có thể đọc để theo dõi bóng tiếp xúc, trong khi vùng đệm stencil được ghi để xác định pixel nhằm xử lý thêm. Hãy xem mục Vấn đề bình minh:2146.

Thông tin cập nhật vào Bình minh

Lệnh gọi lại lỗi không thu được được đặt bằng wgpuDeviceSetUncapturedErrorCallback() giờ đây được gọi ngay khi lỗi xảy ra. Đây là điều mà các nhà phát triển luôn mong đợi và muốn gỡ lỗi. Xem phần thay đổi bình minh:173620.

Phương thức wgpuSurfaceGetPreferredFormat() từ API webgpu.h đã được triển khai. Hãy xem mục Vấn đề bình minh:1362.

Bài viết này chỉ bao gồm một số điểm nổi bật chính. Xem danh sách đầy đủ các thay đổi.

Tính năng mới trong WebGPU

Danh sách tất cả nội dung được đề cập trong loạt bài Có gì mới trong WebGPU.

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113