Tester des sous-groupes
La fonctionnalité de sous-groupes permet de paralléliser les threads au niveau SIMD, ce qui leur permet de communiquer et d'effectuer des opérations mathématiques collectives (par exemple, calculer la somme de 16 nombres). Cela permet de partager des données entre les threads de manière très efficace.
Une implémentation minimale de la proposition de sous-groupes est disponible pour les tests locaux derrière l'indicateur "Prise en charge de WebGPU non sécurisée" dans chrome://flags/#enable-unsafe-webgpu
.
Vous pouvez également tester des sous-groupes sur votre site avec de vrais utilisateurs en vous inscrivant à l'essai Origin. Pour savoir comment préparer votre site à utiliser les essais d'origine, consultez Premiers pas avec les essais d'origine. La phase d'évaluation de l'origine s'étendra de Chrome 128 à Chrome 131 (et se terminera le 19 février 2025). Consultez la section Intent de test.
Lorsque la fonctionnalité "subgroups"
est disponible dans un GPUAdapter
, demandez un GPUDevice
avec cette fonctionnalité pour obtenir la prise en charge des sous-groupes dans WGSL et vérifiez ses limites minSubgroupSize
et maxSubgroupSize
.
Vous devez également activer explicitement cette extension dans votre code WGSL avec enable subgroups;
. Si vous l'activez, vous avez accès aux ajouts suivants:
subgroup_invocation_id
: valeur intégrée pour l'indice du fil de discussion dans le sous-groupe.subgroup_size
: valeur intégrée pour l'accès à la taille du sous-groupe.subgroupBallot(value)
: renvoie un ensemble de champs de bits où le bit correspondant àsubgroup_invocation_id
est défini sur 1 sivalue
est défini sur "true" pour cette invocation active, et sur 0 dans le cas contraire.subgroupBroadcast(value, id)
: diffuse levalue
de l'appel avecsubgroup_invocation_id
correspondant àid
à toutes les invocations du sous-groupe. Remarque:id
doit être une constante de temps de compilation.
D'autres fonctions intégrées telles que subgroupAdd
, subgroupAll
, subgroupElect
et subgroupShuffle
seront ajoutées à l'avenir. Consultez le problème 354738715.
Pour autoriser f16 dans les opérations de sous-groupes, demandez un GPUDevice
avec les fonctionnalités "subgroups"
, "subgroups-f16"
et "shader-f16"
, puis activez-le dans votre code WGSL avec enable f16, subgroups, subgroups_f16;
.
L'extrait de code suivant fournit une base pour bricoler et découvrir le potentiel des sous-groupes.
const adapter = await navigator.gpu.requestAdapter();
if (!adapter.features.has("subgroups")) {
throw new Error("Subgroups support is not available");
}
// Explicitly request subgroups support.
const device = await adapter.requestDevice({
requiredFeatures: ["subgroups"],
});
const shaderModule = device.createShaderModule({ code: `
enable subgroups;
var<workgroup> wgmem : u32;
@group(0) @binding(0)
var<storage, read> inputs : array<u32>;
@group(0) @binding(1)
var<storage, read_write> output : array<u32>;
@compute @workgroup_size(64)
fn main(@builtin(subgroup_size) subgroupSize : u32,
@builtin(subgroup_invocation_id) id : u32,
@builtin(local_invocation_index) lid : u32) {
// One thread per workgroup writes the value to workgroup memory.
if (lid == 0) {
wgmem = inputs[lid];
}
workgroupBarrier();
var v = 0u;
// One thread per subgroup reads the value from workgroup memory
// and shares that value with every other thread in the subgroup
// to reduce local memory bandwidth.
if (id == 0) {
v = wgmem;
}
v = subgroupBroadcast(v, 0);
output[lid] = v;
}`,
});
// Send the appropriate commands to the GPU...
Abandon du paramètre de biais de profondeur pour les lignes et les points
Un changement de spécification WebGPU entraîne une erreur de validation si vous définissez depthBias
, depthBiasSlopeScale
et depthBiasClamp
sur une valeur non nulle lorsque la topologie d'un pipeline de rendu est un type de ligne ou de point. Pour laisser aux développeurs suffisamment de temps pour mettre à jour leur code, un avertissement s'affiche dans la console des outils de développement concernant cette validation à venir, tout en forçant les valeurs à 0 dans ces circonstances. Consultez le problème 352567424.
Masquer l'avertissement DevTools d'erreur non capturée si preventDefault
Dans la console DevTools, les avertissements concernant les événements uncapturederror
ne s'affichent plus si un écouteur d'événements pour uncapturederror
a été enregistré et que la méthode d'événement preventDefault()
a été appelée dans le rappel de l'écouteur d'événements. Ce comportement correspond à la gestion des événements en JavaScript. Consultez l'exemple suivant et le problème 40263619.
const adapter = await navigator.gpu.requestAdapter();
const device = await adapter.requestDevice();
device.addEventListener("uncapturederror", (event) => {
// Prevents browser warning to show up in the DevTools Console.
event.preventDefault();
// TODO: Handle event.error
});
WGSL effectue d'abord l'interpolation de l'échantillonnage, puis :
L'attribut interpolate
WGSL vous permet de gérer l'interpolation des données d'E/S définies par l'utilisateur. Les nouveaux paramètres d'échantillonnage d'interpolation first
(par défaut) et either
vous offrent désormais un contrôle supplémentaire: first
utilise la valeur du premier sommet de la primitive, tandis que either
autorise le premier ou le dernier sommet. Consultez le problème 340278447.
Informations Dawn
L'implémentation de WGPUFuture de Dawn pour gérer les opérations asynchrones est maintenant terminée. Les concepts clés incluent wgpuInstanceProcessEvents pour le traitement opportuniste des événements et WGPUCallbackMode pour définir les emplacements des rappels. WGPUFuture signifie des événements ponctuels avec une durée de vie infinie, et wgpuInstanceWaitAny attend la fin de tout futur ou un délai avant expiration. Voir le problème 42240932.
La valeur CompositeAlphaMode::Auto
n'est plus signalée par Surface::GetCapabilities()
. Il est toujours valide et équivalent à Surface::GetCapabilities().alphaMode[0]
. Voir le problème 292.
Le backend OpenGL est désormais compatible avec Surface
avec un blit de retournement de l'axe Y pour chaque appel Present()
. Voir le problème 344814083.
La méthode Adapter::GetProperties()
est obsolète et remplacée par Adapter::GetInfo()
.
Jaswant, un contributeur externe, a réécrit tous les fichiers CMake, ce qui les rend plus faciles à mettre à jour et permet de créer des précompilations. Consultez le guide de démarrage rapide pour utiliser Dawn dans des projets CMake.
Il ne s'agit là que de quelques-uns des points clés. Consultez la liste exhaustive des commits.
Nouveautés de WebGPU
Liste de tous les éléments abordés dans la série Nouveautés de WebGPU.
Chrome 132
- Utilisation de la vue Texture
- Mélange de textures à virgule flottante 32 bits
- Attribut adapterInfo de GPUDevice
- Configurer le contexte de canevas avec un format non valide génère une erreur JavaScript
- Filtrer les restrictions d'échantillonneur sur les textures
- Tests étendus sur les sous-groupes
- Améliorer l'expérience des développeurs
- Compatibilité expérimentale avec les formats de texture normalisés 16 bits
- Informations sur Dawn
Chrome 131
- Couper les distances en WGSL
- GPUCanvasContext getConfiguration()
- Les primitives de point et de ligne ne doivent pas comporter de biais de profondeur.
- Fonctions intégrées d'analyse inclusive pour les sous-groupes
- Compatibilité expérimentale avec le multi-dessin indirect
- Option de compilation du module de nuanceur "math strict"
- Suppression de la méthode requestAdapterInfo() de GPUAdapter
- Informations sur Dawn
Chrome 130
- Mélange de deux sources
- Améliorations du temps de compilation des nuanceurs sur Metal
- Obsolete de la méthode requestAdapterInfo() de GPUAdapter
- Informations sur Dawn
Chrome 129
- Compatibilité HDR avec le mode de mappage des tons du canevas
- Prise en charge des sous-groupes étendus
- Informations sur Dawn
Chrome 128
- Tester les sous-groupes
- Abandon du paramètre de biais de profondeur pour les lignes et les points
- Masquer l'avertissement DevTools d'erreur non capturée si preventDefault
- WGSL effectue d'abord l'interpolation de l'échantillonnage, puis
- Informations sur Dawn
Chrome 127
- Compatibilité expérimentale d'OpenGL ES sur Android
- Attribut info de GPUAdapter
- Améliorations de l'interopérabilité WebAssembly
- Amélioration des erreurs de l'encodeur de commandes
- Informations sur Dawn
Chrome 126
- Augmentation de la limite maxTextureArrayLayers
- Optimisation de l'importation de tampons pour le backend Vulkan
- Améliorations du temps de compilation des nuanceurs
- Les tampons de commande envoyés doivent être uniques
- Informations sur Dawn
Chrome 125
- Sous-groupes (fonctionnalité en cours de développement)
- Affichage d'une tranche de texture 3D
- Informations sur Dawn
Chrome 124
- Textures de stockage en lecture seule et en lecture/écriture
- Compatibilité avec les service workers et les workers partagés
- Nouveaux attributs d'informations sur l'adaptateur
- Corrections de bugs
- Informations sur Dawn
Chrome 123
- Compatibilité des fonctions intégrées DP4a avec WGSL
- Paramètres de pointeur non restreints dans WGSL
- Syntaxe simplifiée pour le déréférencement des composites en WGSL
- État en lecture seule distinct pour les aspects du pochoir et de la profondeur
- Informations sur Dawn
Chrome 122
- Élargir la couverture avec le mode de compatibilité (fonctionnalité en cours de développement)
- Augmentation de la limite maxVertexAttributes
- Informations sur Dawn
Chrome 121
- Compatibilité avec WebGPU sur Android
- Utiliser DXC au lieu de FXC pour la compilation de nuanceurs sous Windows
- Requêtes de code temporel dans les passes de calcul et de rendu
- Points d'entrée par défaut vers les modules de nuanceurs
- Compatibilité avec display-p3 en tant qu'espace de couleurs GPUExternalTexture
- Informations sur les tas de mémoire
- Informations sur Dawn
Chrome 120
- Compatibilité avec les valeurs à virgule flottante 16 bits dans WGSL
- Repousser les limites
- Modifications apportées à l'état du tampon de profondeur
- Modifications des informations sur les adaptateurs
- Quantification des requêtes d'horodatage
- Fonctionnalités de nettoyage de printemps
Chrome 119
- Textures à virgule flottante 32 bits filtrables
- Format de sommet unorm10-10-10-2
- Format de texture rgb10a2uint
- Informations sur Dawn
Chrome 118
- Compatibilité avec HTMLImageElement et ImageData dans
copyExternalImageToTexture()
- Compatibilité expérimentale avec la texture de stockage en lecture-écriture et en lecture seule
- Informations sur Dawn
Chrome 117
- Désactiver le tampon de sommets
- Désactiver le groupe de liaisons
- Ignorer les erreurs de création de pipeline asynchrone en cas de perte de l'appareil
- Mise à jour de la création de modules de nuanceurs SPIR-V
- Améliorer l'expérience des développeurs
- Mise en cache des pipelines avec une mise en page générée automatiquement
- Informations sur Dawn
Chrome 116
- Intégration de WebCodecs
- Appareil égaré renvoyé par GPUAdapter
requestDevice()
- Maintenir la fluidité de la lecture vidéo si
importExternalTexture()
est appelé - Conformité aux spécifications
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 115
- Extensions de langage WGSL prises en charge
- Compatibilité expérimentale avec Direct3D 11
- Obtenir un GPU distinct par défaut sur l'alimentation secteur
- Améliorer l'expérience des développeurs
- Informations sur Dawn
Chrome 114
- Optimiser JavaScript
- getCurrentTexture() sur un canevas non configuré génère une erreur InvalidStateError
- Mises à jour de WGSL
- Informations sur Dawn