Novedades de WebGPU (Chrome 121)

François Beaufort
François Beaufort

Compatibilidad con WebGPU en Android

El equipo de Chrome se complace en anunciar que WebGPU ahora está habilitada de forma predeterminada en Chrome 121 en dispositivos que ejecutan Android 12 y versiones posteriores con la tecnología de las GPU Qualcomm y ARM.

La compatibilidad se expandirá gradualmente para abarcar una gama más amplia de dispositivos Android, incluidos los que ejecutan Android 11 en un futuro cercano. Esta expansión dependerá de más pruebas y optimización para garantizar una experiencia fluida en una gama más amplia de configuraciones de hardware. Consulta el problema chromium:1497815.

Captura de pantalla de la muestra de WebGPU que se ejecuta en Chrome para Android
Ejemplo de WebGPU que se ejecuta en Chrome para Android.

Usa DXC en lugar de FXC para compilar sombreadores en Windows

Chrome ahora usa la potencia de DXC (Compilador DirectX) para compilar sombreadores en máquinas con Windows D3D12 equipadas con hardware gráfico SM6+. Anteriormente, WebGPU dependía de FXC (compilador de FX) para la compilación de sombreadores en Windows. Si bien era funcional, a FXC le faltaba el conjunto de atributos y las optimizaciones de rendimiento presentes en DXC.

Las pruebas iniciales muestran un aumento promedio del 20% en la velocidad de compilación del sombreador de cómputos cuando se usa DXC en comparación con FXC.

Consultas de marcas de tiempo en pases de procesamiento y procesamiento

Las consultas de marca de tiempo permiten que las aplicaciones WebGPU midan con precisión (hasta un nanosegundo) el tiempo que tardan sus comandos de GPU en ejecutar el procesamiento y el procesamiento. Se usan en gran medida para obtener estadísticas sobre el rendimiento y el comportamiento de las cargas de trabajo de las GPU.

Cuando la función "timestamp-query" está disponible en un GPUAdapter, ahora puedes hacer lo siguiente:

  • Solicita un elemento GPUDevice con la función "timestamp-query".
  • Crea un GPUQuerySet de tipo "timestamp".
  • Usa GPUComputePassDescriptor.timestampWrites y GPURenderPassDescriptor.timestampWrites para definir dónde escribir los valores de marca de tiempo en GPUQuerySet.
  • Resuelve los valores de marca de tiempo en una GPUBuffer con resolveQuerySet().
  • Para volver a leer los valores de la marca de tiempo, copia los resultados de GPUBuffer a la CPU.
  • Decodifica valores de marca de tiempo como BigInt64Array.

Consulta el siguiente ejemplo y el error dawn:1800.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("timestamp-query")) {
  throw new Error("Timestamp query feature is not available");
}
// Explicitly request timestamp query feature.
const device = await adapter.requestDevice({
  requiredFeatures: ["timestamp-query"],
});
const commandEncoder = device.createCommandEncoder();

// Create a GPUQuerySet which holds 2 timestamp query results: one for the
// beginning and one for the end of compute pass execution.
const querySet = device.createQuerySet({ type: "timestamp", count: 2 });
const timestampWrites = {
  querySet,
  beginningOfPassWriteIndex: 0, // Write timestamp in index 0 when pass begins.
  endOfPassWriteIndex: 1, // Write timestamp in index 1 when pass ends.
};
const passEncoder = commandEncoder.beginComputePass({ timestampWrites });
// TODO: Set pipeline, bind group, and dispatch work to be performed.
passEncoder.end();

// Resolve timestamps in nanoseconds as a 64-bit unsigned integer into a GPUBuffer.
const size = 2 * BigInt64Array.BYTES_PER_ELEMENT;
const resolveBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.QUERY_RESOLVE | GPUBufferUsage.COPY_SRC,
});
commandEncoder.resolveQuerySet(querySet, 0, 2, resolveBuffer, 0);

// Read GPUBuffer memory.
const resultBuffer = device.createBuffer({
  size,
  usage: GPUBufferUsage.COPY_DST | GPUBufferUsage.MAP_READ,
});
commandEncoder.copyBufferToBuffer(resolveBuffer, 0, resultBuffer, 0, size);

// Submit commands to the GPU.
device.queue.submit([commandEncoder.finish()]);

// Log compute pass duration in nanoseconds.
await resultBuffer.mapAsync(GPUMapMode.READ);
const times = new BigInt64Array(resultBuffer.getMappedRange());
console.log(`Compute pass duration: ${Number(times[1] - times[0])}ns`);
resultBuffer.unmap();

Debido a inquietudes sobre el ataque de tiempo, las consultas de marca de tiempo se cuantizan con una resolución de 100 microsegundos, lo que proporciona un buen compromiso entre la precisión y la seguridad. En el navegador Chrome, puedes inhabilitar la cuantización de la marca de tiempo habilitando las “Funciones para desarrolladores de WebGPU” flag en chrome://flags/#enable-webgpu-developer-features durante el desarrollo de tu app. Consulta Cuantización de consultas de marcas de tiempo para obtener más información.

Como las GPU pueden restablecer el contador de marca de tiempo ocasionalmente, lo que puede generar valores inesperados, como deltas negativos entre las marcas de tiempo, te recomendamos que revises los cambios de git diff que agregan compatibilidad con consultas de marca de tiempo a la siguiente muestra de Compute Boids.

Captura de pantalla de una muestra de Compute Boids en la que se muestra la consulta de marca de tiempo.
Muestra de Compute Boids con consulta de marca de tiempo.

Puntos de entrada predeterminados a los módulos de sombreador

Para mejorar la experiencia del desarrollador, ahora puedes omitir el entryPoint de tu módulo de sombreador cuando crees una canalización de cómputos o renderización. Si no se encuentra un punto de entrada único para la etapa del sombreador en el código del sombreador, se activará un GPUValidationError. Consulta el siguiente ejemplo y el problema dawn:2254.

const code = `
    @vertex fn vertexMain(@builtin(vertex_index) i : u32) ->
      @builtin(position) vec4f {
       const pos = array(vec2f(0, 1), vec2f(-1, -1), vec2f(1, -1));
       return vec4f(pos[i], 0, 1);
    }
    @fragment fn fragmentMain() -> @location(0) vec4f {
      return vec4f(1, 0, 0, 1);
    }`;
const module = myDevice.createShaderModule({ code });
const format = navigator.gpu.getPreferredCanvasFormat();
const pipeline = await myDevice.createRenderPipelineAsync({
  layout: "auto",
  vertex: { module, entryPoint: "vertexMain" },
  fragment: { module, entryPoint: "fragmentMain", targets: [{ format }] },
  vertex: { module },
  fragment: { module, targets: [{ format }] },
});

Compatibilidad con display-p3 como espacio de color GPUExternalTexture

Ahora puedes establecer el espacio de color de destino "display-p3" cuando importas un GPUExternalTexture desde videos HDR con importExternalTexture(). Consulta cómo WebGPU controla los espacios de color. Consulta el siguiente ejemplo y el error chromium:1330250.

// Create texture from HDR video.
const video = document.querySelector("video");
const texture = myDevice.importExternalTexture({
  source: video,
  colorSpace: "display-p3",
});

Información de los montón de memoria

Para ayudarte a anticipar las limitaciones de memoria cuando asignas grandes cantidades durante el desarrollo de tu app, requestAdapterInfo() ahora expone la información de memoryHeaps, como el tamaño y el tipo de montón de memoria disponibles en el adaptador. Solo se puede acceder a esta función experimental cuando las “Funciones para desarrolladores de WebGPU” marca en chrome://flags/#enable-webgpu-developer-features está habilitada. Consulta el siguiente ejemplo y el problema dawn:2249.

const adapter = await navigator.gpu.requestAdapter();
const adapterInfo = await adapter.requestAdapterInfo();

for (const { size, properties } of adapterInfo.memoryHeaps) {
  console.log(size); // memory heap size in bytes
  if (properties & GPUHeapProperty.DEVICE_LOCAL)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_VISIBLE)  { /* ... */ }
  if (properties & GPUHeapProperty.HOST_COHERENT) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_UNCACHED) { /* ... */ }
  if (properties & GPUHeapProperty.HOST_CACHED)   { /* ... */ }
}
Captura de pantalla de https://webgpureport.org que muestra montones de memoria en la información del adaptador.
Montones de memoria de información del adaptador que se muestran en https://webgpureport.org.

Actualizaciones del amanecer

Se agregaron los métodos HasWGSLLanguageFeature y EnumerateWGSLLanguageFeatures en wgpu::Instance para controlar las funciones del lenguaje WGSL. Consulta el problema dawn:2260.

La función no estándar wgpu::Feature::BufferMapExtendedUsages te permite crear un búfer de GPU con wgpu::BufferUsage::MapRead o wgpu::BufferUsage::MapWrite y cualquier otro wgpu::BufferUsage. Consulta el siguiente ejemplo y el error dawn:2204.

wgpu::BufferDescriptor descriptor = {
  .size = 128,
  .usage = wgpu::BufferUsage::MapWrite | wgpu::BufferUsage::Uniform
};
wgpu::Buffer uniformBuffer = device.CreateBuffer(&descriptor);

uniformBuffer.MapAsync(wgpu::MapMode::Write, 0, 128,
   [](WGPUBufferMapAsyncStatus status, void* userdata)
   {
      wgpu::Buffer* buffer = static_cast<wgpu::Buffer*>(userdata);
      memcpy(buffer->GetMappedRange(), data, sizeof(data));
   },
   &uniformBuffer);

Se documentaron las siguientes funciones: Uso compartido de texturas con ANGLE, con protección multisubproceso D3D11, Sincronización de dispositivos implícita, formatos de textura Norm16, Pases internos de consultas de marca de tiempo, Almacenamiento local de Pixel, Funciones del sombreador y Formatos multiplanares.

El equipo de Chrome creó un repositorio oficial de GitHub para Dawn.

Esto abarca solo algunos de los aspectos más destacados. Consulta la lista exhaustiva de confirmaciones.

Novedades de WebGPU

Una lista de todo lo que se ha abordado en la serie Novedades de WebGPU.

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113