組み込みの AI を使ってみる

公開日: 2024 年 12 月 12 日

組み込み AI を使用すると、独自の AI モデルをデプロイまたは管理しなくても、ウェブ アプリケーションで AI を活用したタスクを実行できます。Chrome AI チームは、タスク固有のウェブ プラットフォーム API と、ブラウザに AI モデルを統合するブラウザ機能を開発しています。Google は、これらの API がユーザーのデバイスのブラウザに実装されたときに機能することを目標としています。

要件

現時点では、これらの API は Chrome でのみ使用できますが、ブラウザ間で標準化することを目標としています。

モデル

Prompt API、Summarizer API、Writer API、Rewriter API は、デスクトップ コンピュータとノートパソコンでローカルに実行するように設計された Gemini Nano をダウンロードします。これらの API はモバイル デバイスでは機能しません。

現時点では、これらの API はテキストからテキストへのモダリティのみをサポートしています。

ハードウェア

Language Detection API と Translation API は、パソコンと Android デバイスの Chrome で動作します。

Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たしている場合に Chrome で動作します。

  • オペレーティング システム: Windows 10 または 11、macOS 13 以降(Ventura 以降)、Linux。Android、iOS、ChromeOS 版 Chrome は、Gemini Nano をベースとする API ではまだサポートされていません。
  • ストレージ: Chrome プロフィールを含むボリュームに 22 GB 以上の空き容量。
  • GPU: 4 GB 以上の RAM。
  • ネットワーク: データ通信量無制限または無制限接続。

これらの要件は、開発プロセスと、作成した機能を利用するユーザーに存在します。

構築を開始

開発のさまざまな段階で利用可能な組み込み AI API がいくつかあります。一部の機能は、送信元のトライアルに参加しているすべてのデベロッパーが利用できます。他の機能は、早期プレビュー プログラムの参加者のみが利用できます。

各 API には、ローカル プロトタイピングとオリジン トライアルのある本番環境の両方で、モデルの使用を開始してダウンロードするための独自の手順があります。

Prompt API はローカルと Chrome 拡張機能でのみ使用できますが、他の API はウェブサイトと Chrome 拡張機能で使用できます。

基準プロセス

Google では、すべてのブラウザで動作するように これらの API を標準化しています。つまり、Google はウェブ プラットフォーム コミュニティに API を提案し、W3C ウェブ インキュベーター コミュニティ グループに移行して、さらなる議論を進めています。

Google は、各 API について W3C、Mozilla、WebKit からフィードバックをリクエストしています。

各 API でのプロセスについて詳しくは、対応するドキュメントをご覧ください。

意見交換とフィードバックの提供

組み込み AI をお試しになった際のフィードバックをお寄せください。