公開日: 2024 年 12 月 12 日
組み込み AI を使用すると、独自の AI モデルをデプロイまたは管理しなくても、ウェブ アプリケーションで AI を活用したタスクを実行できます。Chrome AI チームは、タスク固有のウェブ プラットフォーム API と、ブラウザに AI モデルを統合するブラウザ機能を開発しています。Google は、これらの API がユーザーのデバイスのブラウザに実装されたときに機能することを目標としています。
要件
現時点では、これらの API は Chrome でのみ使用できますが、ブラウザ間で標準化することを目標としています。
モデル
Prompt API、Summarizer API、Writer API、Rewriter API は、デスクトップ コンピュータとノートパソコンでローカルに実行するように設計された Gemini Nano をダウンロードします。これらの API はモバイル デバイスでは機能しません。
現時点では、これらの API はテキストからテキストへのモダリティのみをサポートしています。
ハードウェア
Language Detection API と Translation API は、パソコンと Android デバイスの Chrome で動作します。
Prompt API、Summarizer API、Writer API、Rewriter API は、次の条件を満たしている場合に Chrome で動作します。
- オペレーティング システム: Windows 10 または 11、macOS 13 以降(Ventura 以降)、Linux。Android、iOS、ChromeOS 版 Chrome は、Gemini Nano をベースとする API ではまだサポートされていません。
- ストレージ: Chrome プロフィールを含むボリュームに 22 GB 以上の空き容量。
- GPU: 4 GB を超える VRAM が必要です。
- ネットワーク: データ通信量無制限または無制限接続。
これらの要件は、開発プロセスと、作成した機能を利用するユーザーに存在します。
構築を開始
開発のさまざまな段階で利用可能な組み込み AI API がいくつかあります。一部の機能は、送信元のトライアルに参加しているすべてのデベロッパーが利用できます。他の機能は、早期プレビュー プログラムの参加者のみが利用できます。
各 API には、ローカル プロトタイピングとオリジン トライアルのある本番環境の両方で、モデルの使用を開始してダウンロードするための独自の手順があります。
- Translator API
- Language Detector API
- Writer API と Rewriter API(EPP のみ)
- Summarizer API
- Chrome 拡張機能の Prompt API
- ウェブ向け Prompt API(EPP のみ)
Prompt API はローカルと Chrome 拡張機能でのみ使用できますが、他の API はウェブサイトと Chrome 拡張機能で使用できます。
localhost で API を使用する
これらの API はすべて、Chrome の localhost
で使用できます。手順は次のとおりです。
chrome://flags/#prompt-api-for-gemini-nano
に向かいます。- [有効] を選択します。
- [再起動] をクリックするか、Chrome を再起動します。
Gemini Nano がダウンロードされ、意図したとおりに動作することを確認するには、DevTools を開き、コンソールに (await ai.assistant.capabilities()).available;
と入力します。これにより、readily
が返されます。
localhost のトラブルシューティング
Gemini Nano が想定どおりに動作しない場合は、次の手順を行います。
- Chrome を再起動します。
chrome://components
に向かいます。- [Optimization Guide On Device Model] が存在することを確認します。これは、Gemini Nano が利用可能か、ダウンロード中であることを意味します。
- バージョン番号が表示されていない場合は、[アップデートを確認] をクリックして強制的にダウンロードします。
- DevTools を開き、コンソールに
(await ai.assistant.capabilities()).available;
と入力します。これにより、readily
が返されます。
必要に応じて、しばらく待ってからこの手順を繰り返します。
基準プロセス
Google では、すべてのブラウザで動作するように これらの API を標準化しています。つまり、Google はウェブ プラットフォーム コミュニティに API を提案し、W3C ウェブ インキュベーター コミュニティ グループに移行して、さらなる議論を進めています。
Google は、各 API について W3C、Mozilla、WebKit からフィードバックをリクエストしています。
各 API のこのプロセスについて詳しくは、対応するドキュメントをご覧ください。
意見交換とフィードバックの提供
組み込み AI をお試しになった際のフィードバックをお寄せください。
- 組み込み AI API をすべて確認する。
- 早期プレビュー プログラムに参加して、新しい API をいち早く確認し、メーリング リストにアクセスしましょう。
- Chrome の実装についてフィードバックがある場合は、Chromium のバグを報告してください。
- ウェブ標準について学習する。