Nouveautés de WebGPU (Chrome 128)

François Beaufort
François Beaufort

Expérimenter avec des sous-groupes

La fonctionnalité de sous-groupes active le parallélisme au niveau du SIMD, ce qui permet aux threads d'un groupe de communiquer et d'effectuer des opérations mathématiques collectives (par exemple, le calcul de la somme de 16 nombres). Cela constitue une forme très efficace de partage de données interthread.

Une implémentation minimale de la proposition de sous-groupes est disponible pour les tests en local dans la section "Unsafe WebGPU Support" (Assistance WebGPU non sécurisée). l'indicateur à chrome://flags/#enable-unsafe-webgpu.

Vous pouvez également tester des sous-groupes sur votre site avec de vrais utilisateurs en vous inscrivant à la phase d'évaluation. Consultez Premiers pas avec les phases d'évaluation pour savoir comment préparer votre site à les utiliser. La phase d'évaluation s'exécutera de Chrome 128 à 131 (et se terminera le 19 février 2025). Consultez la section Intention de test.

Lorsque la fonctionnalité "subgroups" est disponible dans un GPUAdapter, demandez un GPUDevice avec cette fonctionnalité pour obtenir la prise en charge des sous-groupes dans WGSL et vérifier ses limites minSubgroupSize et maxSubgroupSize.

Vous devez également activer explicitement cette extension dans votre code WGSL avec enable subgroups;. Lorsque cette option est activée, vous avez accès aux ajouts suivants:

  • subgroup_invocation_id: valeur intégrée pour l'index du thread dans le sous-groupe.
  • subgroup_size: valeur intégrée pour l'accès à la taille des sous-groupes.
  • subgroupBallot(value): renvoie un ensemble de champs de bits où le bit correspondant à subgroup_invocation_id est 1 si value est vrai pour cet appel actif, et 0 dans le cas contraire.
  • subgroupBroadcast(value, id): diffuse value à partir de l'appel avec subgroup_invocation_id correspondant à id à tous les appels du sous-groupe. Remarque: id doit être une constante connue à la compilation.

D'autres fonctions intégrées telles que subgroupAdd, subgroupAll, subgroupElect et subgroupShuffle seront ajoutées ultérieurement. Consultez le problème 354738715.

Pour autoriser f16 dans les opérations de sous-groupes, demandez une GPUDevice avec les fonctionnalités "subgroups", "subgroups-f16" et "shader-f16", puis activez-la dans votre code WGSL avec enable f16, subgroups, subgroups_f16;.

L'extrait de code suivant fournit une base pour bricoler et découvrir le potentiel des sous-groupes.

const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
  throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
  requiredFeatures: ["subgroups"],
});

const shaderModule = device.createShaderModule({ code: `
  enable subgroups;

  var<workgroup> wgmem : u32;

  @group(0) @binding(0)
  var<storage, read> inputs : array<u32>;

  @group(0) @binding(1)
  var<storage, read_write> output : array<u32>;

  @compute @workgroup_size(64)
  fn main(@builtin(subgroup_size) subgroupSize : u32,
          @builtin(subgroup_invocation_id) id : u32,
          @builtin(local_invocation_index) lid : u32) {
    // One thread per workgroup writes the value to workgroup memory.
    if (lid == 0) {
      wgmem = inputs[lid];
    }
    workgroupBarrier();
    var v = 0u;

    // One thread per subgroup reads the value from workgroup memory
    // and shares that value with every other thread in the subgroup
    // to reduce local memory bandwidth.
    if (id == 0) {
      v = wgmem;
    }
    v = subgroupBroadcast(v, 0);
    output[lid] = v;
  }`,
});

// Send the appropriate commands to the GPU...

Abandon de la définition du biais de profondeur pour les lignes et les points

Une modification de la spécification WebGPU entraîne une erreur de validation lorsque vous définissez depthBias, depthBiasSlopeScale et depthBiasClamp sur une valeur non nulle lorsque la topologie d'un pipeline de rendu est un type de ligne ou de point. Afin de laisser suffisamment de temps aux développeurs pour mettre à jour leur code, un avertissement s'affiche dans la console DevTools concernant cette validation à venir, tout en forçant les valeurs à 0 dans ce cas. Consultez le problème 352567424.

Masquer l'avertissement d'erreur non capturée dans les outils de développement si preventDefault

Dans la console des outils de développement, les avertissements pour les événements uncapturederror ne s'affichent plus si un écouteur d'événements pour uncapturederror a été enregistré et que la méthode preventDefault() d'événement a été appelée dans le rappel de l'écouteur d'événements. Ce comportement correspond à la gestion des événements en JavaScript. Consultez l'exemple suivant et le problème 40263619.

const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();

device.addEventListener("uncapturederror", (event) => {
  // Prevents browser warning to show up in the DevTools Console.
  event.preventDefault();

  // TODO: Handle event.error
});

l'interpolation de l'échantillonnage WGSL,

L'attribut WGSL interpolate vous permet de gérer l'interpolation des données d'E/S définies par l'utilisateur. Désormais, les nouveaux paramètres d'échantillonnage interpolé first (par défaut) et either vous offrent un contrôle supplémentaire: first utilise la valeur du premier sommet de la primitive, tandis que either autorise le premier ou le dernier sommet. Consultez le problème 340278447.

Actualités de l'aube

L'implémentation du WGPUFuture de Dawn pour gérer les opérations asynchrones est maintenant terminée. Les concepts clés incluent wgpuInstanceProcessEvents pour le traitement des événements opportunistes et WGPUCallbackMode pour définir des emplacements de rappel. WGPUFuture signifie que les événements ponctuels ont une durée de vie infinie et que wgpuInstanceWaitAny attend la fin de tout événement futur ou un délai d'inactivité. Consultez le problème 42240932.

La valeur CompositeAlphaMode::Auto n'est plus indiquée par Surface::GetCapabilities(). Elle est toujours valide et équivaut à Surface::GetCapabilities().alphaMode[0]. Consultez le problème 292.

Le backend OpenGL prend désormais en charge Surface avec un blit (y-flip) pour chaque appel Present(). Consultez le problème 344814083.

La méthode Adapter::GetProperties() a été abandonnée au profit de Adapter::GetInfo().

Jaswant, un contributeur externe, a réécrit tous les fichiers CMake, pour les mettre à jour plus facilement et permettre des pré-builds. Consultez le guide de démarrage rapide pour utiliser Dawn dans les projets CMake.

Cette présentation ne porte que sur certains points clés. Consultez la liste exhaustive des commits.

Nouveautés de WebGPU

Liste de tous les sujets abordés dans la série Nouveautés de WebGPU

Chrome 128

Chrome 127

Chrome 126

Chrome 125

Chrome 124

Chrome 123

Chrome 122

Chrome 121

Chrome 120

Chrome 119

Chrome 118

Chrome 117

Chrome 116

Chrome 115

Chrome 114

Chrome 113