Erste Schritte mit integrierter KI

Alexandra Klepper

Veröffentlicht am 12. Dezember 2024, zuletzt aktualisiert am 20. Mai 2025

Mit integrierten KI-APIs kann Ihre Webanwendung KI-gestützte Aufgaben ausführen, ohne eigene KI-Modelle bereitstellen oder verwalten zu müssen. Wir arbeiten daran, diese APIs browserübergreifend zu standardisieren.

Voraussetzungen

Für die Verwendung von integrierter KI gelten bestimmte Modell- und Hardwareanforderungen.

Modelle

Die Translator API und die Language Detector API verwenden Expertenmodelle. Alle anderen APIs verwenden ein Sprachmodell, das für die lokale Ausführung auf Computern und Laptops entwickelt wurde.

Die Summarizer API, Writer API, Rewriter API und Proofreader API unterstützen nur die Text-zu-Text-Modalität. Die Prompt API bietet multimodale Funktionen.

Gemini Nano in Chrome

Chrome verwendet die Sprachmodelle von Gemini Nano. Gemini Nano ist auf Mobilgeräten nicht verfügbar.

Ab Chrome 140 unterstützt Gemini Nano Englisch, Spanisch und Japanisch für Eingabe und Ausgabetext.

Bevor Sie die integrierten KI-APIs verwenden, müssen Sie die Richtlinie zur unzulässigen Nutzung von generativer KI von Google akzeptieren.

Hardware

Für Entwickler und Nutzer, die Funktionen mit diesen APIs in Chrome verwenden, gelten die folgenden Anforderungen. Bei anderen Browsern gelten möglicherweise andere Betriebsanforderungen.

Die Language Detector API und die Translator API funktionieren in Chrome auf Computern. Diese APIs funktionieren nicht auf Mobilgeräten.

Die Prompt API, Summarizer API, Writer API, Rewriter API und Proofreader API funktionieren in Chrome, wenn die folgenden Bedingungen erfüllt sind:

Betriebssystem: Windows 10 oder 11, macOS 13 oder höher (Ventura und höher), Linux oder ChromeOS (ab Plattform 16389.0.0) auf Chromebook Plus-Geräten. Chrome für Android, iOS und ChromeOS auf Geräten, die keine Chromebook Plus-Geräte sind, werden von den APIs, die Gemini Nano verwenden, noch nicht unterstützt
Speicher: Mindestens 22 GB freier Speicherplatz auf dem Volume, das Ihr Chrome-Profil enthält.
Integrierte Modelle sollten deutlich kleiner sein. Die genaue Größe kann sich bei Updates leicht ändern.
GPU oder CPU: Integrierte Modelle können mit GPU oder CPU ausgeführt werden.
- GPU: Mehr als 4 GB VRAM.
- CPU: Mindestens 16 GB RAM und mindestens 4 CPU-Kerne.
Netzwerk: Unbegrenzte Daten oder eine nicht getaktete Verbindung.
Wichtiger Begriff: Eine getaktete Verbindung ist eine Internetverbindung mit begrenztem Datenvolumen. WLAN- und Ethernet-Verbindungen sind in der Regel nicht getaktet, während Mobilfunkverbindungen oft getaktet sind.

Hinweis: Die Netzwerkanforderung gilt nur für den ersten Download des Modells. Für die spätere Verwendung des Modells ist keine Netzwerkverbindung erforderlich. Bei der Verwendung des Modells werden keine Daten an Google oder Dritte gesendet.

Die genaue Größe von Gemini Nano kann variieren, da das Modell vom Browser aktualisiert wird. Die aktuelle Größe finden Sie unter chrome://on-device-internals.

Gleich mit dem Erstellen loslegen

Es gibt mehrere integrierte KI-APIs, die sich in verschiedenen Entwicklungsstadien befinden. Einige sind in der stabilen Chrome-Version verfügbar, andere sind für verfügbare Teilnehmer von Ursprungstests verfügbar und wieder andere sind nur für verfügbare Teilnehmer des Early Preview Program verfügbar.

Für jede API gibt es eine eigene Anleitung für den Einstieg und den Download des Modells, sowohl für das lokale Prototyping als auch in Produktionsumgebungen mit den Ursprungstests.

Alle diese APIs können beim Erstellen von Chrome-Erweiterungen verwendet werden.

Download des Modells

APIs sind in Chrome integriert, ebenso die Modelle. Wenn ein Nutzer zum ersten Mal mit diesen APIs interagiert, muss das Modell in den Browser heruntergeladen werden.

Um festzustellen, ob eine API verwendet werden kann, rufen Sie die asynchrone availability() Funktion auf, die ein Promise mit einem der folgenden Werte zurückgibt:

"unavailable": Das Gerät des Nutzers oder die angeforderten Sitzungsoptionen werden nicht unterstützt. Das Gerät hat möglicherweise nicht genügend Strom oder Speicherplatz.
"downloadable": Zum Erstellen einer Sitzung sind zusätzliche Downloads erforderlich, die z. B. ein Expertenmodell, ein Sprachmodell oder eine Feinabstimmung umfassen können. Nutzeraktivierung ist möglicherweise erforderlich, um create() aufzurufen.
"downloading": Downloads laufen und müssen abgeschlossen sein, bevor Sie eine Sitzung verwenden können.
"available": Sie können sofort eine Sitzung erstellen.

Für einige APIs sind zusätzliche Optionen erforderlich, wenn die Verfügbarkeit aufgerufen wird. Für die Prompt API muss beispielsweise die Sprachunterstützung deklariert werden:

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

Nutzeraktivierung

Wenn das Gerät integrierte KI-APIs unterstützt, das Modell aber noch nicht heruntergeladen wurde, muss der Nutzer auf sinnvolle Weise mit Ihrer Seite interagieren, damit Ihre Anwendung eine Sitzung mit create() starten kann.

Verwenden Sie die UserActivation.isActive Eigenschaft, um zu bestätigen, dass ein Nutzer seit dem Laden der Seite direkt mit ihr interagiert hat. Dazu gehören beispielsweise Tippen, Klicken, Tastendrücke, mousedown, oder andere dauerhafte Aktivierungsereignisse.

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

Mit der Summarizer API können Sie Nutzer beispielsweise auffordern, mit einer Schaltfläche „Zusammenfassen“ zu interagieren, um zu aktivieren Summarizer.create(). Alternativ können Sie die Zusammenfassung erstellen, sobald ein Nutzer mit der Eingabe begonnen hat (keydown-Ereignis).

APIs auf „localhost“ verwenden

Alle APIs sind in Chrome unter localhost verfügbar.

Öffnen Sie chrome://flags/#optimization-guide-on-device-model.
Wählen Sie Aktiviert aus.
Klicken Sie auf Neu starten oder starten Sie Chrome neu.

Für APIs, die Gemini Nano verwenden, müssen Sie außerdem chrome://flags/#prompt-api-for-gemini-nano auf Aktiviert oder Aktiviert (mehrsprachig) festlegen. In der DevTools Console können Sie prüfen, ob das Modell heruntergeladen wurde und wie vorgesehen funktioniert. Führen Sie await LanguageModel.availability(); in der Console aus.

Fehlerbehebung bei „localhost“

Wenn die Flags nicht unter chrome://flags angezeigt werden, prüfen Sie, ob Sie die neueste Version von Chrome heruntergeladen haben.

Wenn das Modell nicht wie erwartet funktioniert, gehen Sie so vor:

Starten Sie Chrome neu.
Öffnen Sie chrome://on-device-internals.
Wählen Sie den Tab Modellstatus aus und prüfen Sie, ob Fehler vorliegen.
Öffnen Sie die DevTools und geben Sie LanguageModel.availability(); in die Console ein. Das Ergebnis sollte available sein.

Warten Sie gegebenenfalls einige Zeit und wiederholen Sie diese Schritte.

Standardprozess

Wir arbeiten daran, diese APIs zu standardisieren, damit sie in allen Browsern funktionieren. Dazu haben wir die APIs der Webplattform-Community vorgeschlagen und sie zur weiteren Diskussion in die W3C Web Incubator Community Group verschoben.

Wir bitten das W3C, Mozilla und WebKit um Feedback zu jeder API.

Mitmachen und Feedback geben

Wenn Sie integrierte KI ausprobieren und Feedback haben, freuen wir uns darauf.

Alle integrierten KI-APIs ansehen
Am Early Preview Program teilnehmen um neue APIs vorab zu testen und Zugriff auf unsere Mailingliste zu erhalten
Wenn Sie Feedback zur Implementierung von Chrome haben, melden Sie einen Fehler in Chromium.
Weitere Informationen zu Webstandards