Data publikacji: 12 grudnia 2024 r.
Dzięki wbudowanej AI Twoja aplikacja internetowa może wykonywać zadania oparte na AI bez konieczności wdrażania własnych modeli AI ani zarządzania nimi. Zespół AI w Chrome tworzy interfejsy API platform internetowych do konkretnych zadań oraz funkcje przeglądarki, które integrują modele AI w Twojej przeglądarce. Naszym celem jest zapewnienie, aby te interfejsy API działały po wdrożeniu w przeglądarce na urządzeniu użytkownika.
Wymagania
Obecnie można używać tych interfejsów API tylko w Chrome, ale naszym celem jest ujednolicenie ich w różnych przeglądarkach.
Modele
Prompt API, Summarizer API, Writer API i Rewriter API pobierają Gemini Nano, który jest przeznaczony do uruchamiania lokalnie na komputerach stacjonarnych i przenośnych. Te interfejsy API nie działają na urządzeniach mobilnych.
Obecnie te interfejsy API obsługują tylko tryb tekst-tekst.
Sprzęt
Interfejsy API wykrywania języka i tłumaczenia działają w Chrome na komputerach i urządzeniach z Androidem.
Interfejsy Prompt API, Summarizer API, Writer API i Rewriter API działają w Chrome, gdy są spełnione te warunki:
- System operacyjny: Windows 10 lub 11, macOS 13 lub nowszy (Ventura lub nowszy) lub Linux. Chrome na Androida, iOS i ChromeOS nie są jeszcze obsługiwane przez nasze interfejsy API obsługiwane przez Gemini Nano.
- Pamięć: co najmniej 22 GB na woluminie zawierającym profil Chrome.
- GPU: więcej niż 4 GB pamięci VRAM.
- Sieć: nieograniczona transmisja danych lub nielimitowane połączenie.
Te wymagania obowiązują Cię w trakcie procesu tworzenia aplikacji oraz Twoich użytkowników, którzy korzystają z Twoich funkcji.
Zacznij tworzyć
Dostępnych jest kilka wbudowanych interfejsów API AI na różnych etapach rozwoju. Niektóre są dostępne dla wszystkich deweloperów w ramach testów wersji próbnej, a inne tylko dla uczestników programu wczesnej wersji zapoznawczej.
Każdy interfejs API ma własny zestaw instrukcji, które pomogą Ci rozpocząć pracę i pobrać model. Dotyczy to zarówno prototypowania lokalnego, jak i testów w środowiskach produkcyjnych z użyciem próbnych wersji.
- Translator API
- Language Detector API
- Interfejsy Writer i Rewriter API (tylko EPP)
- Summarizer API
- Prompt API w rozszerzeniach Chrome
- Prompt API for web (tylko EPP)
Interfejs Prompt API jest dostępny tylko lokalnie i w rozszerzeniach do Chrome, ale inne interfejsy API działają w przypadku witryn i rozszerzeń do Chrome.
Korzystanie z interfejsów API na localhost
Wszystkie interfejsy API są dostępne w localhost
w Chrome. Aby to zrobić:
- Jedź do:
chrome://flags/#prompt-api-for-gemini-nano
. - Kliknij Włączono.
- Kliknij Uruchom ponownie lub uruchom ponownie Chrome.
Aby sprawdzić, czy Gemini Nano zostało pobrane i działa zgodnie z oczekiwaniami, otwórz Narzędzia deweloperskie i wpisz (await ai.assistant.capabilities()).available;
w konsoli. Ta instrukcja powinna zwrócić wartość readily
.
Rozwiązywanie problemów z localhostem
Jeśli Gemini Nano nie działa zgodnie z oczekiwaniami, wykonaj te czynności:
- Uruchom ponownie Chrome.
- Jedź do:
chrome://components
. - Sprawdź, czy jest dostępny model przewodnika optymalizacji na urządzeniu. Oznacza to, że Gemini Nano jest dostępny lub jest w trakcie pobierania.
- Jeśli nie ma numeru wersji, kliknij Sprawdź, czy jest dostępna nowsza wersja, aby wymusić pobranie.
- Otwórz Narzędzia deweloperskie i w konsoli wpisz
(await ai.assistant.capabilities()).available;
. Powinien zwrócić wartośćreadily
.
W razie potrzeby zaczekaj chwilę i powtórz te czynności.
Proces dotyczący standardów
Pracujemy nad standaryzacją tych interfejsów API, aby działały we wszystkich przeglądarkach. Oznacza to, że zaproponowaliśmy interfejsy API społeczności platform internetowych i przekazaliśmy je do grupy społecznościowej W3C Web Incubator, aby kontynuować dyskusję.
W przypadku każdego interfejsu API prosimy o opinię W3C, Mozillę i WebKit.
Więcej informacji o tym procesie w przypadku każdego interfejsu API znajdziesz w odpowiedniej dokumentacji.
Zaangażowanie i przesyłanie opinii
Jeśli wypróbujesz wbudowaną AI i masz opinię na jej temat, chętnie ją poznamy.
- Poznaj wszystkie wbudowane interfejsy AI API.
- Dołącz do programu wczesnej wersji zapoznawczej, aby wcześniej zapoznać się z nowymi interfejsami API i zyskać dostęp do naszej listy mailingowej.
- Jeśli chcesz podzielić się opinią na temat implementacji w Chrome, zgłoś błąd w Chromium.
- Dowiedz się więcej o standardach internetowych.