公開日: 2025 年 2 月 26 日
サブグループを使用して ML ワークロードを改善する
1 年間の開発とトライアルを経て、SIMD レベルの並列処理を可能にするサブグループの WebGPU 機能が利用可能になりました。これにより、ワークグループ内のスレッドが通信して、数値の合計計算などの集約的な数学演算を実行できるようになります。また、スレッド間のデータを効率的に共有する方法も提供されます。元の提案と chromestatus のエントリをご覧ください。
なお、オリジン トライアルでは、一部のデバイスで、Google Meet のサブグループをマトリックス ベクトル乗算シェーダーのパック整数の内積とベンチマークしたところ、速度が 2.3 ~ 2.9 倍に向上しました。
GPUAdapter
で "subgroups"
機能が使用可能な場合は、この機能を含む GPUDevice
をリクエストして、WGSL でサブグループをサポートします。subgroupMinSize
アダプタ情報と subgroupMaxSize
アダプタ情報の値を確認すると便利です。たとえば、特定のサイズのサブグループを必要とするハードコードされたアルゴリズムがある場合などです。
また、コンピューティング シェーダー ステージとフラグメント シェーダー ステージの両方で次の組み込み値にアクセスするには、WGSL コードで enable subgroups;
を使用してこの拡張機能を明示的に有効にする必要があります。
subgroup_invocation_id
: サブグループ内のスレッドのインデックスの組み込み値。subgroup_size
: サブグループ サイズ アクセス用の組み込み値。
多数のサブグループ組み込み関数(subgroupAdd()
、subgroupBallot()
、subgroupBroadcast()
、subgroupShuffle()
など)により、サブグループ内の呼び出し間で効率的な通信と計算が可能になります。これらのサブグループ オペレーションは、単一命令マルチスレッド(SIMT)オペレーションに分類されます。また、呼び出しの四重で動作する四重組み込み関数により、四重内でのデータ通信が容易になります。
"shader-f16"
と "subgroups"
の両方の特徴を持つ GPUDevice
をリクエストする場合は、サブグループで f16 値を使用できます。
次のサンプルは、サブグループを探索する際の良い出発点です。このサンプルは、subgroupExclusiveMul()
組み込み関数を使用して、中間結果を通信するためにメモリを読み書きすることなく階乗を計算するシェーダーを示しています。
ブレンド可能として浮動小数点数フィルタ可能なテクスチャ タイプのサポートを削除
"float32-blendable"
機能で32 ビットの浮動小数点テクスチャのブレンドが利用可能になったため、ブレンド可能として浮動小数点フィルタリング可能なテクスチャ タイプの誤ったサポートが削除されました。問題 364987733 をご覧ください。
Dawn の更新
Dawn では macOS 11 と iOS 14 が必要になり、Metal 2.3 以降のみがサポートされるようになりました。問題 381117827 をご覧ください。
EnumerateWGSLLanguageFeatures()
は、wgpu::Instance
の新しい GetWGSLLanguageFeatures()
メソッドに置き換えられました。問題 368672124 を参照。
次のバインディング タイプには Undefined
値があり、バインディング レイアウトのデフォルト値が変更されています。問題 377820810 をご覧ください。
wgpu::BufferBindingType::Undefined
をUniform
に変更wgpu::SamplerBindingType::Undefined
をFiltering
に変更wgpu::TextureSampleType::Undefined
をFloat
に変更wgpu::StorageTextureAccess::Undefined
はWriteOnly
になりました
以下に、主なハイライトをいくつかご紹介します。コミットの一覧(すべて網羅)をご覧ください。
WebGPU の新機能
WebGPU の新機能シリーズで取り上げられたすべての内容のリスト。
Chrome 134
Chrome 133
- unnorm8x4-bgra と 1 コンポーネントの頂点形式の追加
- 未定義の値で不明な上限をリクエストできるようにする
- WGSL アライメント ルールの変更
- 破棄による WGSL のパフォーマンスの向上
- 外部テクスチャに VideoFrame displaySize を使用する
- copyExternalImageToTexture を使用してデフォルト以外の向きの画像を処理する
- デベロッパー エクスペリエンスの向上
- featureLevel で互換モードを有効にする
- 試験運用版のサブグループ機能のクリーンアップ
- maxInterStageShaderComponents の上限を非推奨にする
- Dawn の最新情報
Chrome 132
- テクスチャ ビューの使用
- 32 ビット浮動小数点テクスチャのブレンド
- GPUDevice の adapterInfo 属性
- 無効な形式でキャンバス コンテキストを構成すると JavaScript エラーがスローされる
- テクスチャでのフィルタリング サンプラーの制限
- サブグループの拡張テスト
- デベロッパー エクスペリエンスの向上
- 16 ビットの正規化テクスチャ形式の試験運用版サポート
- Dawn の最新情報
Chrome 131
- WGSL で距離をクリップする
- GPUCanvasContext getConfiguration()
- ポイント プリミティブとライン プリミティブに深度バイアスを設定しないでください
- サブグループの包括的スキャンの組み込み関数
- マルチドロー間接の試験運用版サポート
- シェーダー モジュールのコンパイル オプションの厳密な数学
- GPUAdapter requestAdapterInfo() を削除
- Dawn の最新情報
Chrome 130
Chrome 129
Chrome 128
- サブグループのテスト
- 線と点の深度バイアスの設定を非推奨とする
- preventDefault の場合、キャプチャされていないエラーの DevTools 警告を非表示にする
- WGSL はまずサンプリングを補間し、次に次のいずれかを行います。
- Dawn の最新情報
Chrome 127
- Android での OpenGL ES の試験運用版サポート
- GPUAdapter info 属性
- WebAssembly 相互運用性の改善
- コマンド エンコーダのエラーを改善
- Dawn の最新情報
Chrome 126
- maxTextureArrayLayers の上限を引き上げ
- Vulkan バックエンドのバッファ アップロードの最適化
- シェーダーのコンパイル時間の改善
- 送信されるコマンド バッファは一意である必要があります
- Dawn の最新情報
Chrome 125
Chrome 124
Chrome 123
- WGSL での DP4a 組み込み関数のサポート
- WGSL でのポインタ パラメータの制限なし
- WGSL でのコンポジットの参照解除の構文糖衣
- ステンシルと深度アスペクトの読み取り専用状態を分離
- Dawn の最新情報
Chrome 122
Chrome 121
- Android で WebGPU をサポート
- Windows でシェーダーのコンパイルに FXC ではなく DXC を使用する
- コンピューティング パスとレンダリング パスのタイムスタンプ クエリ
- シェーダー モジュールのデフォルトのエントリ ポイント
- GPUExternalTexture の色空間として display-p3 をサポート
- メモリヒープ情報
- Dawn の最新情報
Chrome 120
Chrome 119
Chrome 118
copyExternalImageToTexture()
での HTMLImageElement と ImageData のサポート- 読み取り / 書き込みストレージ テクスチャと読み取り専用ストレージ テクスチャの試験運用版サポート
- Dawn の最新情報
Chrome 117
- 頂点バッファを設定解除する
- バインド グループを設定解除する
- デバイスが紛失した場合の非同期パイプラインの作成エラーを抑制
- SPIR-V シェーダー モジュールの作成に関する更新
- デベロッパー エクスペリエンスの向上
- 自動生成されたレイアウトを使用したパイプラインのキャッシュ
- Dawn の最新情報
Chrome 116
- WebCodecs の統合
- GPUAdapter
requestDevice()
によって返された紛失したデバイス importExternalTexture()
が呼び出された場合に動画の再生をスムーズに維持する- 仕様への準拠
- デベロッパー エクスペリエンスの向上
- Dawn の最新情報
Chrome 115
- サポートされている WGSL 言語拡張機能
- Direct3D 11 の試験運用版サポート
- AC 電源でデフォルトで個別の GPU を取得する
- デベロッパー エクスペリエンスの向上
- Dawn の最新情報
Chrome 114
- JavaScript を最適化する
- 未構成のキャンバスで getCurrentTexture() を呼び出すと InvalidStateError がスローされる
- WGSL の更新
- Dawn の最新情報