WebGPU의 새로운 기능 (Chrome 128)

François Beaufort
François Beaufort

하위 그룹 실험

하위 그룹 기능을 사용하면 SIMD 수준의 동시 로드를 지원하므로 그룹 내의 스레드가 통신하고 집합 수학 연산 (예: 16개의 숫자 합계 계산)을 실행할 수 있습니다. 이를 통해 매우 효율적인 교차 스레드 데이터 공유가 가능합니다.

하위 그룹 제안서의 최소 구현은 chrome://flags/#enable-unsafe-webgpu의 '안전하지 않은 WebGPU 지원' 플래그 뒤에서 로컬 테스트에 사용할 수 있습니다.

Origin Trial에 가입하여 실제 사용자를 대상으로 사이트의 하위 그룹을 사용해 볼 수도 있습니다. 출처 무료 체험판을 사용하도록 사이트를 준비하는 방법은 출처 무료 체험판 시작하기를 참고하세요. 오리진 트라이얼은 Chrome 128~131에서 진행되며 2025년 2월 19일에 종료됩니다. 실험 의도를 참고하세요.

GPUAdapter에서 "subgroups" 기능을 사용할 수 있는 경우 이 기능이 있는 GPUDevice를 요청하여 WGSL에서 하위 그룹 지원을 받고 minSubgroupSizemaxSubgroupSize 제한을 확인합니다.

또한 WGSL 코드에서 enable subgroups;를 사용하여 이 확장 프로그램을 명시적으로 사용 설정해야 합니다. 이 옵션을 사용 설정하면 다음과 같은 추가 기능을 사용할 수 있습니다.

  • subgroup_invocation_id: 하위 그룹 내 대화목록의 색인에 대한 내장 값입니다.
  • subgroup_size: 하위 그룹 크기 액세스를 위한 내장 값입니다.
  • subgroupBallot(value): 활성 호출에 대해 value이 true인 경우 subgroup_invocation_id에 해당하는 비트가 1이고 그렇지 않은 경우에는 0인 비트 필드 집합을 반환합니다.
  • subgroupBroadcast(value, id): 호출에서 id와 일치하는 subgroup_invocation_id를 사용하여 하위 그룹 내의 모든 호출에 value를 브로드캐스트합니다. 참고: id는 컴파일-시간 상수여야 합니다.

향후 subgroupAdd, subgroupAll, subgroupElect, subgroupShuffle와 같은 더 많은 기본 제공 함수가 추가될 예정입니다. 문제 354738715를 참고하세요.

하위 그룹 작업에서 f16을 허용하려면 "subgroups", "subgroups-f16", "shader-f16" 기능으로 GPUDevice를 요청한 다음 WGSL 코드에서 enable f16, subgroups, subgroups_f16;를 사용하여 사용 설정하세요.

다음 코드 스니펫은 하위 그룹의 잠재력을 조정하고 발견할 수 있는 기반을 제공합니다.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

선과 점에 대한 깊이 편향 설정 지원 중단

WebGPU 사양 변경으로 인해 렌더링 파이프라인의 토폴로지가 선 또는 점 유형인 경우 depthBias, depthBiasSlopeScale, depthBiasClamp를 0이 아닌 값으로 설정하면 유효성 검사 오류가 발생합니다. 개발자가 코드를 업데이트할 수 있는 충분한 시간을 제공하기 위해 DevTools 콘솔에 예정된 유효성 검사에 관한 경고가 표시되고 이러한 상황에서 값이 0으로 강제됩니다. 문제 352567424를 참고하세요.

preventDefault인 경우 포착되지 않은 오류 DevTools 경고 숨기기

DevTools 콘솔에서 uncapturederror의 이벤트 리스너가 등록되고 이벤트 리스너 콜백 내에서 이벤트 preventDefault() 메서드가 호출된 경우 uncapturederror 이벤트에 대한 경고가 더 이상 표시되지 않습니다. 이 동작은 JavaScript의 이벤트 처리와 일치합니다. 다음 예시와 문제 40263619를 참고하세요.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

WGSL은 먼저 샘플링을 보간하고 다음 중 하나를 실행합니다.

WGSL interpolate 속성을 사용하면 사용자 정의 IO 데이터 보간을 관리할 수 있습니다. 이제 새로운 보간 샘플링 매개변수 first (기본값) 및 either를 사용하여 추가로 제어할 수 있습니다. first는 원시 도형의 첫 번째 정점 값을 사용하고 either는 첫 번째 또는 마지막 정점을 허용합니다. 문제 340278447을 참고하세요.

Dawn 업데이트

비동기 작업을 처리하기 위한 Dawn의 WGPUFuture 구현이 완료되었습니다. 주요 개념에는 기회주의적 이벤트 처리를 위한 wgpuInstanceProcessEvents와 콜백 위치를 정의하기 위한 WGPUCallbackMode가 있습니다. WGPUFuture는 무한한 전체 기간을 갖는 일회성 이벤트를 나타내고 wgpuInstanceWaitAny는 future 또는 시간 초과 완료를 기다립니다. 문제 42240932를 참고하세요.

이제 CompositeAlphaMode::Auto 값이 Surface::GetCapabilities()에 의해 보고되지 않습니다. 여전히 유효하며 Surface::GetCapabilities().alphaMode[0]와 같습니다. 문제 292를 참고하세요.

이제 OpenGL 백엔드가 각 Present() 호출에 대해 y 플립 블리트가 있는 Surface를 지원합니다. 문제 344814083을 참고하세요.

Adapter::GetProperties() 메서드는 지원 중단되고 Adapter::GetInfo()를 대신 사용합니다.

외부 참여자인 Jaswant가 모든 CMake 파일을 다시 작성하여 더 쉽게 업데이트하고 사전 빌드를 허용하도록 했습니다. CMake 프로젝트에서 Dawn을 사용하는 방법은 빠른 시작 가이드를 참고하세요.

여기에는 주요 내용 중 일부만 다룹니다. 전체 커밋 목록을 확인하세요.

WebGPU의 새로운 기능

WebGPU의 새로운 기능 시리즈에서 다룬 모든 항목의 목록입니다.

Chrome 131

Chrome 130

Chrome 129

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113