Veröffentlicht am 12. Dezember 2024, zuletzt aktualisiert am 20. Mai 2025
Mit integrierten KI-APIs kann Ihre Webanwendung KI-gestützte Aufgaben ausführen, ohne eigene KI-Modelle bereitstellen oder verwalten zu müssen. Wir arbeiten daran, diese APIs browserübergreifend zu standardisieren.
Voraussetzungen
Für die Verwendung von integrierter KI gelten bestimmte Modell- und Hardwareanforderungen.
Modelle
Die Translator API und die Language Detector API verwenden Expertenmodelle. Alle anderen APIs verwenden ein Sprachmodell, das für die lokale Ausführung auf Computern und Laptops entwickelt wurde.
Die Summarizer API, Writer API, Rewriter API und Proofreader API unterstützen nur die Text-zu-Text-Modalität. Die Prompt API bietet multimodale Funktionen.
Gemini Nano in Chrome
Chrome verwendet die Sprachmodelle von Gemini Nano. Gemini Nano ist auf Mobilgeräten nicht verfügbar.
Ab Chrome 140 unterstützt Gemini Nano Englisch, Spanisch und Japanisch für Eingabe und Ausgabetext.
Bevor Sie die integrierten KI-APIs verwenden, müssen Sie die Richtlinie zur unzulässigen Nutzung von generativer KI von Google akzeptieren.
Hardware
Für Entwickler und Nutzer, die Funktionen mit diesen APIs in Chrome verwenden, gelten die folgenden Anforderungen. Bei anderen Browsern gelten möglicherweise andere Betriebsanforderungen.
Die Language Detector API und die Translator API funktionieren in Chrome auf Computern. Diese APIs funktionieren nicht auf Mobilgeräten.
Die Prompt API, Summarizer API, Writer API, Rewriter API und Proofreader API funktionieren in Chrome, wenn die folgenden Bedingungen erfüllt sind:
- Betriebssystem: Windows 10 oder 11, macOS 13 oder höher (Ventura und höher), Linux oder ChromeOS (ab Plattform 16389.0.0) auf Chromebook Plus-Geräten. Chrome für Android, iOS und ChromeOS auf Geräten, die keine Chromebook Plus-Geräte sind, werden von den APIs, die Gemini Nano verwenden, noch nicht unterstützt
- Speicher: Mindestens 22 GB freier Speicherplatz auf dem Volume, das Ihr Chrome-Profil enthält.
- GPU oder CPU: Integrierte Modelle können mit GPU oder CPU ausgeführt werden.
- GPU: Mehr als 4 GB VRAM.
- CPU: Mindestens 16 GB RAM und mindestens 4 CPU-Kerne.
- Netzwerk: Unbegrenzte Daten oder eine nicht getaktete Verbindung.
Die genaue Größe von Gemini Nano kann variieren, da das Modell vom Browser aktualisiert wird. Die aktuelle Größe finden Sie unter chrome://on-device-internals.
Gleich mit dem Erstellen loslegen
Es gibt mehrere integrierte KI-APIs, die sich in verschiedenen Entwicklungsstadien befinden. Einige sind in der stabilen Chrome-Version verfügbar, andere sind für verfügbare Teilnehmer von Ursprungstests verfügbar und wieder andere sind nur für verfügbare Teilnehmer des Early Preview Program verfügbar.
Für jede API gibt es eine eigene Anleitung für den Einstieg und den Download des Modells, sowohl für das lokale Prototyping als auch in Produktionsumgebungen mit den Ursprungstests.
- Translator API
- Language Detector API
- Summarizer API
- Writer API und Rewriter API
- Proofreader API
- Prompt API
Alle diese APIs können beim Erstellen von Chrome-Erweiterungen verwendet werden.
Download des Modells
APIs sind in Chrome integriert, ebenso die Modelle. Wenn ein Nutzer zum ersten Mal mit diesen APIs interagiert, muss das Modell in den Browser heruntergeladen werden.
Um festzustellen, ob eine API verwendet werden kann, rufen Sie die asynchrone
availability() Funktion auf, die ein Promise mit einem der folgenden
Werte zurückgibt:
"unavailable": Das Gerät des Nutzers oder die angeforderten Sitzungsoptionen werden nicht unterstützt. Das Gerät hat möglicherweise nicht genügend Strom oder Speicherplatz."downloadable": Zum Erstellen einer Sitzung sind zusätzliche Downloads erforderlich, die z. B. ein Expertenmodell, ein Sprachmodell oder eine Feinabstimmung umfassen können. Nutzeraktivierung ist möglicherweise erforderlich, umcreate()aufzurufen."downloading": Downloads laufen und müssen abgeschlossen sein, bevor Sie eine Sitzung verwenden können."available": Sie können sofort eine Sitzung erstellen.
Für einige APIs sind zusätzliche Optionen erforderlich, wenn die Verfügbarkeit aufgerufen wird. Für die Prompt API muss beispielsweise die Sprachunterstützung deklariert werden:
// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });
Nutzeraktivierung
Wenn das Gerät integrierte KI-APIs unterstützt, das Modell aber noch nicht
heruntergeladen wurde, muss der Nutzer auf sinnvolle Weise mit Ihrer Seite interagieren, damit Ihre
Anwendung eine Sitzung mit create() starten kann.
Verwenden Sie die UserActivation.isActive
Eigenschaft, um zu bestätigen, dass ein Nutzer seit dem Laden der Seite
direkt mit ihr interagiert hat. Dazu gehören beispielsweise Tippen, Klicken, Tastendrücke, mousedown, oder
andere dauerhafte Aktivierungsereignisse.
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
Mit der Summarizer API können Sie Nutzer beispielsweise auffordern, mit einer Schaltfläche „Zusammenfassen“ zu interagieren, um
zu aktivieren
Summarizer.create(). Alternativ können Sie die Zusammenfassung erstellen, sobald ein Nutzer mit der Eingabe begonnen hat
(keydown-Ereignis).
APIs auf „localhost“ verwenden
Alle APIs sind in Chrome unter localhost verfügbar.
- Öffnen Sie
chrome://flags/#optimization-guide-on-device-model. - Wählen Sie Aktiviert aus.
- Klicken Sie auf Neu starten oder starten Sie Chrome neu.
Für APIs, die Gemini Nano verwenden, müssen Sie außerdem
chrome://flags/#prompt-api-for-gemini-nano auf Aktiviert oder
Aktiviert (mehrsprachig) festlegen. In der DevTools Console können Sie prüfen, ob das Modell heruntergeladen wurde und wie vorgesehen funktioniert.
Führen Sie await LanguageModel.availability(); in der Console aus.
Fehlerbehebung bei „localhost“
Wenn die Flags nicht unter chrome://flags angezeigt werden, prüfen Sie, ob Sie
die neueste Version von Chrome heruntergeladen haben.
Wenn das Modell nicht wie erwartet funktioniert, gehen Sie so vor:
- Starten Sie Chrome neu.
- Öffnen Sie
chrome://on-device-internals. - Wählen Sie den Tab Modellstatus aus und prüfen Sie, ob Fehler vorliegen.
- Öffnen Sie die DevTools und geben Sie
LanguageModel.availability();in die Console ein. Das Ergebnis sollteavailablesein.
Warten Sie gegebenenfalls einige Zeit und wiederholen Sie diese Schritte.
Standardprozess
Wir arbeiten daran, diese APIs zu standardisieren, damit sie in allen Browsern funktionieren. Dazu haben wir die APIs der Webplattform-Community vorgeschlagen und sie zur weiteren Diskussion in die W3C Web Incubator Community Group verschoben.
Wir bitten das W3C, Mozilla und WebKit um Feedback zu jeder API.
Mitmachen und Feedback geben
Wenn Sie integrierte KI ausprobieren und Feedback haben, freuen wir uns darauf.
- Alle integrierten KI-APIs ansehen
- Am Early Preview Program teilnehmen um neue APIs vorab zu testen und Zugriff auf unsere Mailingliste zu erhalten
- Wenn Sie Feedback zur Implementierung von Chrome haben, melden Sie einen Fehler in Chromium.
- Weitere Informationen zu Webstandards