Pierwsze kroki z wbudowaną AI

Data publikacji: 12 grudnia 2024 r.

Dzięki wbudowanej AI Twoja aplikacja internetowa może wykonywać zadania oparte na AI bez konieczności wdrażania własnych modeli AI ani zarządzania nimi. Zespół AI w Chrome tworzy interfejsy API platform internetowych do konkretnych zadań oraz funkcje przeglądarki, które integrują modele AI w Twojej przeglądarce. Naszym celem jest zapewnienie, aby te interfejsy API działały po wdrożeniu w przeglądarce na urządzeniu użytkownika.

Wymagania

Obecnie można używać tych interfejsów API tylko w Chrome, ale naszym celem jest ujednolicenie ich w różnych przeglądarkach.

Modele

Prompt API, Summarizer API, Writer API i Rewriter API pobierają Gemini Nano, który jest przeznaczony do uruchamiania lokalnie na komputerach stacjonarnych i przenośnych. Te interfejsy API nie działają na urządzeniach mobilnych.

Obecnie te interfejsy API obsługują tylko tryb tekst-tekst.

Sprzęt

Interfejsy API wykrywania języka i tłumaczenia działają w Chrome na komputerach i urządzeniach z Androidem.

Interfejsy Prompt API, Summarizer API, Writer API i Rewriter API działają w Chrome, gdy są spełnione te warunki:

  • System operacyjny: Windows 10 lub 11, macOS 13 lub nowszy (Ventura lub nowszy) lub Linux. Chrome na Androida, iOS i ChromeOS nie są jeszcze obsługiwane przez nasze interfejsy API obsługiwane przez Gemini Nano.
  • Pamięć: co najmniej 22 GB na woluminie zawierającym profil Chrome.
  • GPU: więcej niż 4 GB pamięci VRAM.
  • Sieć: nieograniczona transmisja danych lub nielimitowane połączenie.

Te wymagania obowiązują Cię w trakcie procesu tworzenia aplikacji oraz Twoich użytkowników, którzy korzystają z Twoich funkcji.

Zacznij tworzyć

Dostępnych jest kilka wbudowanych interfejsów API AI na różnych etapach rozwoju. Niektóre są dostępne dla wszystkich deweloperów w ramach testów wersji próbnej, a inne tylko dla uczestników programu wczesnej wersji zapoznawczej.

Każdy interfejs API ma własny zestaw instrukcji, które pomogą Ci rozpocząć pracę i pobrać model. Dotyczy to zarówno prototypowania lokalnego, jak i testów w środowiskach produkcyjnych z użyciem próbnych wersji.

Interfejs Prompt API jest dostępny tylko lokalnie i w rozszerzeniach do Chrome, ale inne interfejsy API działają w przypadku witryn i rozszerzeń do Chrome.

Korzystanie z interfejsów API na localhost

Wszystkie interfejsy API są dostępne w localhost w Chrome. Aby to zrobić:

  1. Jedź do: chrome://flags/#prompt-api-for-gemini-nano.
  2. Kliknij Włączono.
  3. Kliknij Uruchom ponownie lub uruchom ponownie Chrome.

Aby sprawdzić, czy Gemini Nano zostało pobrane i działa zgodnie z oczekiwaniami, otwórz Narzędzia deweloperskie i wpisz (await ai.assistant.capabilities()).available; w konsoli. Ta instrukcja powinna zwrócić wartość readily.

Rozwiązywanie problemów z localhostem

Jeśli Gemini Nano nie działa zgodnie z oczekiwaniami, wykonaj te czynności:

  1. Uruchom ponownie Chrome.
  2. Jedź do: chrome://components.
  3. Sprawdź, czy jest dostępny model przewodnika optymalizacji na urządzeniu. Oznacza to, że Gemini Nano jest dostępny lub jest w trakcie pobierania.
    • Jeśli nie ma numeru wersji, kliknij Sprawdź, czy jest dostępna nowsza wersja, aby wymusić pobranie.
  4. Otwórz Narzędzia deweloperskie i w konsoli wpisz (await ai.assistant.capabilities()).available;. Powinien zwrócić wartość readily.

W razie potrzeby zaczekaj chwilę i powtórz te czynności.

Proces dotyczący standardów

Pracujemy nad standaryzacją tych interfejsów API, aby działały we wszystkich przeglądarkach. Oznacza to, że zaproponowaliśmy interfejsy API społeczności platform internetowych i przekazaliśmy je do grupy społecznościowej W3C Web Incubator, aby kontynuować dyskusję.

W przypadku każdego interfejsu API prosimy o opinię W3C, Mozillę i WebKit.

Więcej informacji o tym procesie w przypadku każdego interfejsu API znajdziesz w odpowiedniej dokumentacji.

Zaangażowanie i przesyłanie opinii

Jeśli wypróbujesz wbudowaną AI i masz opinię na jej temat, chętnie ją poznamy.