RenderingNG アーキテクチャ

Chris Harrelson

ここでは、RenderingNG のコンポーネントピースの設定方法と、レンダリングパイプラインがどのように流れるかについて説明します。

レンダリングのタスクは、上位レベルから順に次のとおりです。

画面上のピクセルにコンテンツをレンダリングします。
コンテンツの状態を変化させる視覚効果をアニメーション化します。
入力に応じてスクロールします。
デベロッパースクリプトやその他のサブシステムが応答できるように、適切な場所に入力を転送します。

レンダリングするコンテンツは、各ブラウザタブのフレームのツリーとブラウザインターフェースです。また、タッチスクリーン、マウス、キーボードなどのハードウェアデバイスからの未加工の入力イベントのストリーミング。

各フレームには以下が含まれます。

DOM の状態
CSS
キャンバス
画像、動画、フォント、SVG などの外部リソース

フレームは、HTML ドキュメントとその URL です。ブラウザのタブに読み込まれたウェブページには、トップレベルのフレーム、トップレベルのドキュメントに含まれる iframe の各子フレーム、およびその再帰的な iframe 子孫があります。

視覚効果は、スクロール、変換、クリップ、フィルタ、不透明度、ブレンドなど、ビットマップに適用されるグラフィックオペレーションです。

アーキテクチャコンポーネント

RenderingNG では、これらのタスクは複数のステージとコードコンポーネントに論理的に分割されます。コンポーネントは、さまざまな CPU プロセス、スレッド、およびそれらのスレッド内のサブコンポーネントに配置されます。これらは、すべてのウェブコンテンツの信頼性、スケーラブルなパフォーマンス、拡張性を実現するうえで重要な役割を果たします。

レンダリングパイプラインの構造

レンダリングパイプラインの図。 — 矢印は、各ステージの入力と出力を示します。ステージは色で表され、実行するスレッドまたはプロセスを示します。状況に応じて、ステージが複数の場所で実行される場合があります。そのため、一部のステージは 2 色になっています。緑色のステージはレンダリングプロセスのメインスレッド、黄色はレンダリングプロセスのコンポーザ、オレンジ色のステージはビジュアリゼーションプロセスです。

レンダリングはパイプラインで行われ、その過程で複数のステージとアーティファクトが作成されます。各ステージは、レンダリング内で 1 つの明確に定義されたタスクを実行するコードを表します。アーティファクトは、ステージの入出力であるデータ構造です。

ステージは次のとおりです。

アニメーション: 宣言型タイムラインに基づいて、計算されたスタイルを変更し、プロパティツリーを時間の経過とともに変更します。
スタイル: CSS を DOM に適用し、計算スタイルを作成します。
レイアウト: 画面上の DOM 要素のサイズと位置を決定し、不変のフラグメントツリーを作成します。
プリペイント: プロパティツリーを計算し、必要に応じて既存のディスプレイリストと GPU テクスチャタイルを無効にします。
スクロール: プロパティツリーを変更して、ドキュメントとスクロール可能な DOM 要素のスクロールオフセットを更新します。
ペイント: DOM から GPU テクスチャタイルをラスタ化する方法を記述するディスプレイリストを計算します。
commit: プロパティツリーとディスプレイリストをコンポジタスレッドにコピーします。
レイヤ化: ディスプレイリストを合成レイヤリストに分割して、独立したラスタライズとアニメーションを実現します。
ラスター、デコード、ペイントワークレット: ディスプレイリスト、エンコードされた画像、ペイントワークレットコードをそれぞれ GPU テクスチャタイルに変換します。
有効化: GPU タイルを画面に描画して配置する方法と、視覚効果を示すコンポジタフレームを作成します。
集計: すべての可視コンポジタフレームのコンポジタフレームを 1 つのグローバルコンポジタフレームに結合します。
描画: GPU で集約されたコンポジタフレームを実行して、画面上のピクセルを作成します。

レンダリングパイプラインのステージは、必要ない場合はスキップできます。たとえば、視覚効果やスクロールのアニメーションでは、レイアウト、プリペイント、ペイントをスキップできます。そのため、図ではアニメーションとスクロールが黄色と緑のドットで示されています。視覚効果のためにレイアウト、プリペイント、ペイントをスキップできる場合は、コンポジタスレッドで完全に実行し、メインスレッドをスキップできます。

ブラウザ UI のレンダリングはここでは直接示されていませんが、この同じパイプラインの簡素化バージョンと考えることができます（実際、その実装ではコードの多くを共有しています）。動画（直接描画されない）は通常、フレームを GPU テクスチャタイルに変換し、コンポーザフレームと描画ステップに接続する独立したコードでレンダリングされます。

プロセスとスレッドの構造

CPU プロセス

複数の CPU プロセスを使用すると、サイト間およびブラウザの状態からのパフォーマンスとセキュリティの分離、GPU ハードウェアからの安定性とセキュリティの分離を実現できます。

CPU プロセスのさまざまな部分を示す図

レンダリングプロセスは、1 つのサイトとタブの組み合わせの入力をレンダリング、アニメーション化、スクロール、ルーティングします。レンダリングプロセスは複数あります。
ブラウザプロセスは、ブラウザ UI の入力（アドレスバー、タブのタイトル、アイコンなど）のレンダリング、アニメーション化、ルーティングを行い、残りの入力を適切なレンダリングプロセスに転送します。ブラウザのプロセスは 1 つです。
ビジュアリゼーションプロセスは、複数のレンダリングプロセスとブラウザプロセスからの合成を集約します。GPU を使用してラスタ処理と描画を行います。Viz プロセスは 1 つです。

異なるサイトは常に異なるレンダリングプロセスに分離されます。

通常、同じサイトの複数のブラウザのタブまたはウィンドウは、タブが関連している（一方が他方を開いているなど）場合を除き、異なるレンダリングプロセスで処理されます。デスクトップ版 Chromium では、メモリ負荷が高い場合、関連していなくても、同じサイトの複数のタブが同じレンダリングプロセスに配置されることがあります。

1 つのブラウザタブ内では、異なるサイトのフレームは常に異なるレンダリングプロセスにありますが、同じサイトのフレームは常に同じレンダリングプロセスにあります。レンダリングの観点から、複数のレンダリングプロセスの重要な利点は、クロスサイト iframe とタブが互いにパフォーマンスの分離を実現することです。また、オリジンはさらに分離することもできます。

通常、描画する GPU と画面は 1 つしかないため、Chromium 全体に 1 つの Viz プロセスが存在します。

Viz を独自のプロセスに分離すると、GPU ドライバやハードウェアのバグが発生した場合の安定性が向上します。また、セキュリティ分離にも適しています。これは、Vulkan などの GPU API や一般的なセキュリティにとって重要です。

ブラウザにはタブやウィンドウが多数あり、それらすべてに描画するブラウザ UI ピクセルがあるため、ブラウザプロセスが 1 つしかないのはなぜでしょうか。その理由は、一度にフォーカスされるのは 1 つのタブのみであるためです。実際、表示されていないブラウザタブはほとんどが無効になり、GPU メモリがすべて破棄されます。ただし、複雑なブラウザ UI レンダリング機能は、レンダリングプロセス（WebUI）にもますます実装されています。これはパフォーマンス分離のためではなく、Chromium のウェブレンダリングエンジンの使いやすさを活用するためです。

古い Android デバイスでは、WebView で使用する場合、レンダリングプロセスとブラウザプロセスが共有されます（これは Android の Chromium 全般には適用されず、WebView にのみ適用されます）。WebView では、ブラウザプロセスも埋め込みアプリと共有され、WebView にはレンダリングプロセスが 1 つだけあります。

保護された動画コンテンツをデコードするユーティリティプロセスもあります。このプロセスは、上の図には示されていません。

スレッド

スレッドを使用すると、タスクの遅延、パイプラインの並列化、複数のバッファリングがあっても、パフォーマンスの分離と応答性を実現できます。

レンダリングプロセスの図。

メインスレッドは、スクリプト、レンダリングイベントループ、ドキュメントのライフサイクル、ヒットテスト、スクリプトイベントのディスパッチ、HTML、CSS などのデータ形式の解析を実行します。
- メインスレッドヘルパーは、エンコードまたはデコードを必要とする画像ビットマップや blob の作成などのタスクを実行します。
- Web Worker はスクリプトを実行し、OffscreenCanvas のレンダリングイベントループを実行します。
コンポジタスレッドは、入力イベントを処理し、ウェブコンテンツのスクロールとアニメーションを実行し、ウェブコンテンツの最適なレイヤ化を計算し、画像のデコード、ペイントワークレット、ラスタータスクを調整します。
- コンポジタスレッドヘルパーは、Viz ラスタータスクを調整し、画像デコードタスク、ペイントワークレット、フォールバックラスターを実行します。
メディア、デマルチプライヤー、またはオーディオ出力スレッドは、ビデオストリームとオーディオストリームをデコード、処理、同期します。（動画はメインのレンダリングパイプラインと並行して実行されます）。

メインスレッドとコンポーザスレッドを分離することは、アニメーションとスクロールをメインスレッドの処理からパフォーマンス分離するために非常に重要です。

同じサイトの複数のタブやフレームが同じプロセスに含まれる場合でも、レンダリングプロセスごとにメインスレッドは 1 つだけです。ただし、さまざまなブラウザ API で実行される処理とはパフォーマンスが分離されます。たとえば、Canvas API での画像ビットマップとブロブの生成は、メインスレッドのヘルパースレッドで実行されます。

同様に、レンダリングプロセスごとにコンポジタスレッドは 1 つだけです。コンポジタスレッドで非常に負荷の高いオペレーションはすべて、コンポジタワーカースレッドまたは Viz プロセスに委任されるため、通常は 1 つしかないことが問題になることはありません。この処理は、入力ルーティング、スクロール、アニメーションと並行して実行できます。コンポジタワーカースレッドは、Viz プロセスで実行されるタスクを調整しますが、ドライバのバグなど、Chromium の制御外の理由ですべての場所での GPU アクセラレーションが失敗することがあります。このような状況では、ワーカースレッドは CPU でフォールバックモードで処理を行います。

コンポジタワーカースレッドの数は、デバイスの機能によって異なります。たとえば、デスクトップは CPU コアが多く、モバイルデバイスよりもバッテリーの制約が少ないため、通常はより多くのスレッドを使用します。これはスケールアップとスケールダウンの例です。

レンダリングプロセスのスレッド処理アーキテクチャは、次の 3 つの最適化パターンを適用したものです。

ヘルパースレッド: 長時間実行されるサブタスクを追加のスレッドに送信し、親スレッドが他の同時リクエストに応答できるようにします。メインスレッドヘルパースレッドとコンポーザヘルパースレッドは、この手法の良い例です。
マルチバッファリング: 新しいコンテンツをレンダリングするときに以前にレンダリングされたコンテンツを表示し、レンダリングのレイテンシを隠します。コンポジタスレッドはこの手法を使用します。
パイプラインの並列化: レンダリングパイプラインを複数の場所で同時に実行します。このように、メインスレッドのレンダリング更新が行われている場合でも、スクロールとアニメーションを並行して実行できるため、スクロールとアニメーションを高速化できます。

ブラウザのプロセス

レンダリングスレッドと合成スレッド、レンダリングスレッドと合成スレッドヘルパーの関係を示すブラウザプロセスの図。

レンダリングと合成のスレッドは、ブラウザ UI の入力に応答し、他の入力を正しいレンダリングプロセスに転送します。また、ブラウザ UI のレイアウトとペイントを行います。
レンダリングと合成のスレッドヘルパーは、画像デコードタスクとフォールバックラスターまたはデコードを実行します。

ブラウザプロセスのレンダリングスレッドとコンポジットスレッドは、メインスレッドとコンポーザスレッドが 1 つに統合されていることを除き、レンダリングプロセスのコードと機能に似ています。この場合、長いメインスレッドタスクからのパフォーマンスの分離は必要ないため、必要なスレッドは 1 つだけです。

ビジュアリゼーションプロセス

Viz プロセスには、GPU メインスレッドとディスプレイコンポジタスレッドが含まれます。

GPU メインスレッドは、ディスプレイリストと動画フレームを GPU テクスチャタイルに変換し、コンポーザフレームを画面に描画します。
ディスプレイコンポジタスレッドは、各レンダリングプロセスとブラウザプロセスのコンポジットを集約して最適化し、画面に表示するための単一のコンポジタフレームにします。

ラスター処理と描画は通常、同じスレッドで実行されます。これは、どちらも GPU リソースに依存しており、GPU をマルチスレッドで確実に使用することが難しいためです（GPU へのマルチスレッドアクセスを容易にすることが、新しい Vulkan 標準を開発する動機の 1 つです）。Android WebView では、WebView がネイティブアプリに埋め込まれているため、描画用の OS レベルのレンダリングスレッドが別途用意されています。他のプラットフォームでも、今後このようなスレッドが用意される可能性があります。

ディスプレイコンポーザは常に応答可能である必要があり、GPU メインスレッドの遅延の原因となる可能性のあるものをブロックしないため、別のスレッドにあります。GPU メインスレッドの速度低下の原因の一つは、ベンダー固有の GPU ドライバなど、Chromium 以外のコードへの呼び出しです。これらのコードは、予測しにくい方法で遅くなる可能性があります。

コンポーネントの構造

各レンダリングプロセスのメインスレッドまたはコンポジタスレッド内には、構造化された方法で相互にやり取りする論理ソフトウェアコンポーネントがあります。

レンダリングプロセスのメインスレッドコンポーネント

Blink レンダラの図。

Blink レンダラの場合:

ローカルフレームツリーフラグメントは、ローカルフレームのツリーとフレーム内の DOM を表します。
DOM と Canvas API コンポーネントには、これらの API のすべての実装が含まれています。
ドキュメントライフサイクルランナーは、commit ステップまでのレンダリングパイプラインのステップを実行します。
入力イベントのヒットテストとディスパッチ コンポーネントは、ヒットテストを実行してイベントのターゲットとなる DOM 要素を特定し、入力イベントディスパッチアルゴリズムとデフォルトの動作を実行します。

レンダリングイベントループスケジューラとランナーは、イベントループで何をいつ実行するかを決定します。デバイスのディスプレイに合わせてレンダリングが実行されるようにスケジュールします。

フレームツリーの図。

ローカルフレームツリーフラグメントは少し複雑です。フレームツリーは、メインページとその子 iframe を再帰的に表すことを思い出してください。フレームがレンダリングプロセスでレンダリングされる場合は、そのプロセスにローカルです。それ以外の場合はリモートです。

レンダリングプロセスに応じてフレームを色分けできます。上の画像では、緑色の円はすべて 1 つのレンダリングプロセス内のフレームです。オレンジ色の円は 2 つ目のプロセス内にあり、青色の円は 3 つ目のプロセス内にあります。

ローカルフレームツリーフラグメントは、フレームツリー内の同じ色の接続コンポーネントです。画像には、サイト A 用に 2 つ、サイト B 用に 1 つ、サイト C 用に 1 つのローカルフレームツリーがあります。各ローカルフレームツリーには、独自の Blink レンダラコンポーネントが割り当てられます。ローカルフレームツリーの Blink レンダラは、他のローカルフレームツリーと同じレンダリングプロセスにある場合もあれば、そうでない場合もあります。これは、前述のようにレンダリングプロセスの選択方法によって決まります。

レンダリングプロセスのコンポジタスレッド構造

レンダリングプロセスのコンポジタコンポーネントを示す図。

レンダリングプロセスのコンポジタコンポーネントには次のものが含まれます。

合成レイヤリスト、ディスプレイリスト、プロパティツリーを維持するデータハンドラ。
レンダリングパイプラインのアニメーション、スクロール、合成、ラスター、デコード、有効化のステップを実行するライフサイクルランナー。（アニメーションとスクロールは、メインスレッドとコンポーザの両方で発生する可能性があることに注意してください）。
入力とヒットテストハンドラは、合成レイヤの解像度で入力処理とヒットテストを実行し、スクロールジェスチャーをコンポジタスレッドで実行できるかどうか、およびヒットテストのターゲットとするレンダリングプロセスを決定します。

実践的なアーキテクチャの例

この例では、次の 3 つのタブがあります。

タブ 1: foo.com

<html>
  <iframe id=one src="foo.com/other-url"></iframe>
  <iframe  id=two src="bar.com"></iframe>
</html>

タブ 2: bar.com

<html>
 …
</html>

タブ 3: baz.com html <html> … </html>

これらのタブのプロセス、スレッド、コンポーネントの構造は次のとおりです。

タブのプロセスの図。

レンダリングの 4 つの主要なタスクの例を 1 つずつ見ていきましょう。注意事項:

画面上のピクセルにコンテンツをレンダリングします。
コンテンツの視覚効果を状態間でアニメーション化します。
入力に応じてスクロールします。
デベロッパースクリプトやその他のサブシステムが応答できるように、入力を適切な場所に効率的に転送します。

タブ 1 の変更された DOM をレンダリングするには:

デベロッパースクリプトが foo.com のレンダリングプロセスで DOM を変更します。
Blink レンダラは、レンダリングが必要であることをコンポジタに伝えます。
コンポジタは、レンダリングが必要であることを Viz に伝えます。
Viz は、レンダリングの開始をコンポジターに通知します。
コンポジタは開始シグナルを Blink レンダラに転送します。
メインスレッドのイベントループランナーは、ドキュメントのライフサイクルを実行します。
メインスレッドは、結果をコンポジタスレッドに送信します。
コンポジタイベントループランナーは、コンポジットのライフサイクルを実行します。
ラスタータスクはすべて Viz for Raster に送信されます（多くの場合、これらのタスクは複数あります）。
Viz は GPU でコンテンツをラスタライズします。
Viz はラスタータスクの完了を確認します。注: Chromium は通常、ラスター処理が完了するのを待たず、代わりに同期トークンを使用します。このトークンは、ステップ 15 の実行前にラスタータスクによって解決する必要があります。
コンポジタフレームが Viz に送信されます。
Viz は、foo.com レンダリングプロセス、bar.com iframe レンダリングプロセス、ブラウザ UI のコンポジタフレームを集約します。
Viz が抽選をスケジュールします。
Viz は、集約されたコンポジタフレームを画面に描画します。

タブ 2 で CSS 変換遷移をアニメーション化するには:

bar.com レンダリングプロセスのコンポジタスレッドは、既存のプロパティツリーを変更することで、コンポジタイベントループでアニメーションをティックします。これにより、コンポジターのライフサイクルが再実行されます。（ラスタータスクとデコードタスクが発生することもあります。ここでは示していません）。
コンポジタフレームが Viz に送信されます。
Viz は、foo.com レンダリングプロセス、bar.com レンダリングプロセス、ブラウザ UI のコンポジタフレームを集約します。
Viz が抽選をスケジュールします。
Viz は、集約されたコンポジタフレームを画面に描画します。

タブ 3 でウェブページをスクロールするには:

一連の input イベント（マウス、タップ、キーボード）がブラウザプロセスに送信されます。
各イベントは、baz.com のレンダリングプロセスのコンポジタスレッドに転送されます。
コンポジタは、メインスレッドがイベントを認識する必要があるかどうかを判断します。
必要に応じて、イベントはメインスレッドに送信されます。
メインスレッドは、input イベントリスナー（pointerdown、touchstar、pointermove、touchmove、wheel）を起動して、リスナーがイベントで preventDefault を呼び出すかどうかを確認します。
メインスレッドは、preventDefault がコンポーザに呼び出されたかどうかを返します。
そうでない場合、入力イベントはブラウザプロセスに送り返されます。
ブラウザプロセスは、このイベントを他の最近のイベントと組み合わせてスクロールジェスチャーに変換します。
スクロールジェスチャーが baz.com のレンダリングプロセスのコンポジタスレッドに再び送信されます。
スクロールが適用され、bar.com レンダリングプロセスのコンポーザスレッドがコンポーザイベントループでアニメーションをティックします。これにより、プロパティツリー内のスクロールオフセットが変更され、コンポーザのライフサイクルが再実行されます。また、メインスレッドに scroll イベント（ここには示されていません）を発生させるよう指示します。
コンポジタフレームが Viz に送信されます。
Viz は、foo.com レンダリングプロセス、bar.com レンダリングプロセス、ブラウザ UI のコンポジタフレームを集約します。
Viz が抽選をスケジュールします。
Viz は、集約されたコンポジタフレームを画面に描画します。

タブ 1 の iframe #2 のハイパーリンクで click イベントを転送するには:

input イベント（マウス、タップ、キーボード）がブラウザプロセスに届きます。近似ヒットテストを実行して、bar.com iframe レンダリングプロセスがクリックを受け取るべきかどうかを判断し、そのプロセスにクリックを送信します。
bar.com のコンポーズスレッドは、click イベントを bar.com のメインスレッドに転送し、レンダリングイベントループタスクをスケジュールして処理します。
bar.com のメインスレッドの入力イベントプロセッサは、iframe 内のどの DOM 要素がクリックされたかをヒットテストで判断し、スクリプトが検出できるように click イベントを発生させます。preventDefault が検出されなかったため、ハイパーリンクに移動します。
ハイパーリンクのリンク先ページが読み込まれると、前の例の「変更された DOM をレンダリングする」と同様の手順で新しい状態がレンダリングされます。（これらの後続の変更はここには示されていません）。

重要なポイント

レンダリングの仕組みを覚えて体得するには、かなりの時間がかかります。

最も重要なポイントは、レンダリングパイプラインが慎重なモジュラー化と細部への配慮により、多くの自己完結型コンポーネントに分割されていることです。これらのコンポーネントは、スケーラブルなパフォーマンスと拡張性を最大化するために、並列プロセスとスレッドに分割されています。

各コンポーネントは、最新のウェブアプリのパフォーマンスと機能を実現するうえで重要な役割を果たします。

主要なデータ構造について説明します。これは、コードコンポーネントと同様に RenderingNG にとって重要です。

イラスト: Una Kravets