發布日期:2024 年 12 月 12 日
有了內建 AI,網頁應用程式就能執行 AI 輔助工作,不必部署或管理自己的 AI 模型。Chrome AI 團隊正在開發專屬於特定工作的網路平台 API 和瀏覽器功能,以便在瀏覽器中整合 AI 模型。我們希望這些 API 在使用者裝置上的瀏覽器中實作時能夠正常運作。
需求條件
目前您只能在 Chrome 中使用這些 API,但我們希望在各瀏覽器中將這些 API 標準化。
模型
Prompt API、Summarizer API、Writer API 和 Rewriter API 會下載 Gemini Nano,這項工具可在電腦上執行。這些 API 不適用於行動裝置。
目前這些 API 僅支援文字轉文字模式。
硬體
語言偵測和翻譯 API 可在 Chrome 的電腦版和 Android 裝置上運作。
在 Chrome 中,Prompt API、Summarizer API、Writer API 和 Rewriter API 會在下列條件下運作:
- 作業系統:Windows 10 或 11;macOS 13 以上版本 (Ventura 及後續版本);或 Linux。由 Gemini Nano 支援的 API 尚未支援 Android 版、iOS 版和 ChromeOS 版 Chrome。
- 儲存空間:含有 Chrome 設定檔的磁碟區至少有 22 GB。
- GPU:VRAM 必須大於 4 GB。
- 網路:無限上網流量或無限上網連線。
這些規定適用於您在開發過程中,以及使用您建構的功能的使用者。
開始建構
在不同的開發階段,您可以使用多種內建 AI API。其中有些功能適用於原始測試中的所有開發人員,有些則僅適用於預覽版計畫早期參與者。
每個 API 都有一組操作說明,可讓您開始使用及下載模型,無論是在本機原型設計,還是在實際工作環境中使用原始試用版皆可。
- Translator API
- Language Detector API
- Writer 和 Rewriter API (僅限 EPP)
- Summarizer API
- Chrome 擴充功能中的提示 API
- 網頁版提示 API (僅限 EPP)
雖然 Prompt API 只能在本機和 Chrome 擴充功能中使用,但其他 API 則適用於網站和 Chrome 擴充功能。
在 localhost 上使用 API
所有 API 皆可在 Chrome 的 localhost
中使用。請按照下列步驟操作:
- 前往
chrome://flags/#prompt-api-for-gemini-nano
。 - 選取「已啟用」。
- 按一下「重新啟動」或重新啟動 Chrome。
如要確認 Gemini Nano 已下載並正常運作,請開啟開發人員工具,然後在控制台中輸入 (await ai.assistant.capabilities()).available;
。這應該會傳回 readily
。
排解 localhost 問題
如果 Gemini Nano 無法正常運作,請按照下列步驟操作:
- 重新啟動 Chrome。
- 前往
chrome://components
。 - 確認「Optimization Guide On Device Model」是否存在。這表示 Gemini Nano 已可使用或正在下載。
- 如果沒有列出版本號碼,請按一下「檢查更新」強制下載。
- 開啟開發人員工具,然後在控制台中輸入
(await ai.assistant.capabilities()).available;
。這應該會傳回readily
。
如有需要,請等待一段時間,然後重複執行這些步驟。
標準程序
我們正在努力將這些 API 標準化,讓這些 API 可在所有瀏覽器上運作。也就是說,我們已向網站平台社群提出 API,並將其移至 W3C Web Incubator Community Group 進行進一步討論。
我們會向 W3C、Mozilla 和 WebKit 索取每個 API 的意見回饋。
如要進一步瞭解每個 API 的這項程序,請參閱對應的說明文件。
互動並分享意見回饋
如果你試用內建 AI 後有任何意見,歡迎與我們分享。
- 探索所有內建 AI API。
- 加入搶先預覽計畫,搶先查看新 API 並加入我們的電子報訂閱清單。
- 如對 Chrome 的實作方式有任何意見,請回報 Chromium 錯誤。
- 瞭解網頁標準。