Prompt API

Thomas Steiner

Alexandra Klepper

Veröffentlicht: 20. Mai 2025, zuletzt aktualisiert: 21. September 2025

Erklärung	Web	Erweiterungen	Chrome-Status	Absicht
GitHub	Origin-Test	Chrome 138	Ansicht	Absicht, Tests durchzuführen

Mit der Prompt API können Sie Anfragen in natürlicher Sprache an Gemini Nano im Browser senden.

Es gibt viele Möglichkeiten, die Prompt API zu verwenden. Sie könnten beispielsweise Folgendes erstellen:

KI-basierte Suche: Fragen basierend auf dem Inhalt einer Webseite beantworten.
Personalisierte Newsfeeds: Erstellen Sie einen Feed, in dem Artikel dynamisch in Kategorien eingeteilt werden und Nutzer diese Inhalte filtern können.
Benutzerdefinierte Inhaltsfilter: Nachrichtenartikel analysieren und Inhalte basierend auf nutzerdefinierten Themen automatisch unkenntlich machen oder ausblenden.
Kalendertermine erstellen: Entwickeln Sie eine Chrome-Erweiterung, die automatisch Termindetails von Webseiten extrahiert, damit Nutzer mit wenigen Schritten Kalendereinträge erstellen können.
Nahtlose Kontaktextraktion: Erstellen Sie eine Erweiterung, die Kontaktdaten von Websites extrahiert, damit Nutzer leichter Kontakt mit einem Unternehmen aufnehmen oder ihrer Kontaktliste Details hinzufügen können.

Das sind nur einige Möglichkeiten. Wir sind gespannt darauf, was Sie damit anstellen.

Hardwareanforderungen prüfen

Für Entwickler und Nutzer, die Funktionen mit diesen APIs in Chrome verwenden, gelten die folgenden Anforderungen. Bei anderen Browsern gelten möglicherweise andere Betriebsanforderungen.

Die Language Detector API und die Translator API funktionieren in Chrome auf dem Computer. Diese APIs funktionieren nicht auf Mobilgeräten.

Die Prompt API, Summarizer API, Writer API, Rewriter API und Proofreader API funktionieren in Chrome, wenn die folgenden Bedingungen erfüllt sind:

Betriebssystem: Windows 10 oder 11; macOS 13 oder höher (Ventura und höher); Linux; oder ChromeOS (ab Plattform 16389.0.0) auf Chromebook Plus-Geräten. Chrome für Android, iOS und ChromeOS auf Geräten, die keine Chromebook Plus-Geräte sind, werden von den APIs, die Gemini Nano verwenden, noch nicht unterstützt.
Speicher: Mindestens 22 GB freier Speicherplatz auf dem Volume, das Ihr Chrome-Profil enthält.
Integrierte Modelle sollten deutlich kleiner sein. Die genaue Größe kann sich durch Updates leicht ändern.
GPU oder CPU: Integrierte Modelle können mit GPU oder CPU ausgeführt werden.
- GPU: Mehr als 4 GB VRAM.
- CPU: mindestens 16 GB RAM und mindestens 4 CPU-Kerne.
Netzwerk: Unbegrenzte Daten oder eine Verbindung ohne Volumenbegrenzung.
Schlüsselbegriff: Eine getaktete Verbindung ist eine Internetverbindung mit einem begrenzten Datenvolumen. WLAN- und Ethernet-Verbindungen sind in der Regel standardmäßig nicht getaktet, während Mobilfunkverbindungen oft getaktet sind.

Hinweis: Die Netzwerkanforderung gilt nur für den ersten Download des Modells. Für die spätere Verwendung des Modells ist keine Netzwerkverbindung erforderlich. Bei der Verwendung des Modells werden keine Daten an Google oder Dritte gesendet.

Die genaue Größe von Gemini Nano kann variieren, da das Modell vom Browser aktualisiert wird. Die aktuelle Größe finden Sie unter chrome://on-device-internals.

Prompt API verwenden

Für die Prompt API wird das Gemini Nano-Modell in Chrome verwendet. Die API ist zwar in Chrome integriert, das Modell wird jedoch beim ersten Mal, wenn ein Ursprung die API verwendet, separat heruntergeladen. Bevor Sie diese API verwenden, müssen Sie die Richtlinie zur unzulässigen Nutzung von generativer KI von Google zur Kenntnis nehmen.

Rufen Sie LanguageModel.availability() auf, um festzustellen, ob das Modell einsatzbereit ist.

const availability = await LanguageModel.availability({
  // The same options in `prompt()` or `promptStreaming()`
});

Prüfen Sie auf Nutzeraktivierung, um den Download auszulösen und das Sprachmodell zu instanziieren. Rufen Sie dann die Funktion create() auf.

const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener('downloadprogress', (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});

Wenn die Antwort auf availability() downloading war, achte auf den Downloadfortschritt und informiere den Nutzer, da der Download einige Zeit in Anspruch nehmen kann.

Auf localhost verwenden

Alle integrierten KI-APIs sind in Chrome unter localhost verfügbar. Legen Sie die folgenden Flags auf Aktiviert fest:

chrome://flags/#optimization-guide-on-device-model
chrome://flags/#prompt-api-for-gemini-nano-multimodal-input

Klicken Sie dann auf Neu starten oder starten Sie Chrome neu. Wenn Fehler auftreten, führen Sie die Fehlerbehebung für localhost durch.

Modellparameter

Die Funktion params() informiert Sie über die Parameter des Sprachmodells. Das Objekt hat die folgenden Felder:

defaultTopK: Der Standardwert für Top-K.
maxTopK: Der maximale Top-K-Wert.
defaultTemperature: Die Standard-Temperatur.
maxTemperature: Die maximale Temperatur.

// Only available when using the Prompt API for Chrome Extensions.
await LanguageModel.params();
// {defaultTopK: 3, maxTopK: 128, defaultTemperature: 1, maxTemperature: 2}

Sitzung erstellen

Sobald die Prompt API ausgeführt werden kann, erstellen Sie eine Sitzung mit der Funktion create().

const session = await LanguageModel.create();

Sitzung mit der Prompt API für Chrome-Erweiterungen erstellen

Wenn Sie die Prompt API für Chrome-Erweiterungen verwenden, kann jede Sitzung mit topK und temperature mithilfe eines optionalen Optionenobjekts angepasst werden. Die Standardwerte für diese Parameter werden von LanguageModel.params() zurückgegeben.

// Only available when using the Prompt API for Chrome Extensions.
const params = await LanguageModel.params();
// Initializing a new session must either specify both `topK` and
// `temperature` or neither of them.
// Only available when using the Prompt API for Chrome Extensions.
const slightlyHighTemperatureSession = await LanguageModel.create({
  temperature: Math.max(params.defaultTemperature * 1.2, 2.0),
  topK: params.defaultTopK,
});

Das optionale Optionenobjekt der Funktion create() akzeptiert auch das Feld signal, mit dem Sie ein AbortSignal übergeben können, um die Sitzung zu beenden.

const controller = new AbortController();
stopButton.onclick = () => controller.abort();

const session = await LanguageModel.create({
  signal: controller.signal,
});

Kontext mit ersten Prompts hinzufügen

Mit Initial-Prompts können Sie dem Sprachmodell Kontext zu früheren Interaktionen geben, damit der Nutzer beispielsweise eine gespeicherte Sitzung nach einem Neustart des Browsers fortsetzen kann.

const session = await LanguageModel.create({
  initialPrompts: [
    { role: 'system', content: 'You are a helpful and friendly assistant.' },
    { role: 'user', content: 'What is the capital of Italy?' },
    { role: 'assistant', content: 'The capital of Italy is Rome.' },
    { role: 'user', content: 'What language is spoken there?' },
    {
      role: 'assistant',
      content: 'The official language of Italy is Italian. [...]',
    },
  ],
});

Antworten mit einem Präfix einschränken

Sie können zusätzlich zu den vorherigen Rollen eine "assistant"-Rolle hinzufügen, um die vorherigen Antworten des Modells zu erläutern. Beispiel:

const followup = await session.prompt([
  {
    role: "user",
    content: "I'm nervous about my presentation tomorrow"
  },
  {
    role: "assistant",
    content: "Presentations are tough!"
  }
]);

In einigen Fällen möchten Sie möglicherweise nicht eine neue Antwort anfordern, sondern einen Teil der Antwortnachricht für die "assistant"-Rolle vorab ausfüllen. Das kann hilfreich sein, um das Sprachmodell dazu zu bringen, ein bestimmtes Antwortformat zu verwenden. Fügen Sie dazu prefix: true an die Nachricht mit der nachgestellten "assistant"-Rolle an. Beispiel:

const characterSheet = await session.prompt([
  {
    role: 'user',
    content: 'Create a TOML character sheet for a gnome barbarian',
  },
  {
    role: 'assistant',
    content: '```toml\n',
    prefix: true,
  },
]);

Erwartete Eingabe und Ausgabe hinzufügen

Die Prompt API bietet multimodale Funktionen und unterstützt mehrere Sprachen. Legen Sie beim Erstellen der Sitzung die Modalitäten und Sprachen für expectedInputs und expectedOutputs fest.

type: Erwartete Modalität.
- Für expectedInputs kann dies text, image oder audio sein.
- Für expectedOutputs ist mit der Prompt API nur text möglich.
languages: Array zum Festlegen der erwarteten Sprache(n). Die Prompt API akzeptiert "en", "ja" und "es". Die Unterstützung für weitere Sprachen ist in Arbeit.
- Legen Sie für expectedInputs die Sprache des System-Prompts und eine oder mehrere erwartete Sprachen für Nutzer-Prompts fest.
- Legen Sie eine oder mehrere expectedOutputs-Sprachen fest.

const session = await LanguageModel.create({
  expectedInputs: [
    { type: "text", languages: ["en" /* system prompt */, "ja" /* user prompt */] }
  ],
  expectedOutputs: [
    { type: "text", languages: ["ja"] }
  ]
});

Sie erhalten möglicherweise eine "NotSupportedError" DOMException, wenn das Modell auf eine nicht unterstützte Ein- oder Ausgabe trifft.

Multimodale Funktionen

Mit diesen Funktionen haben Sie folgende Möglichkeiten:

Nutzern erlauben, in einer Chat-Anwendung gesendete Sprachnachrichten transkribieren zu lassen
Beschreiben Sie ein Bild, das auf Ihre Website hochgeladen wurde, damit es in einer Bildunterschrift oder einem Alternativtext verwendet werden kann.

In der Demo Mediarecorder Audio Prompt sehen Sie, wie Sie die Prompt API mit Audioeingabe verwenden, und in der Demo Canvas Image Prompt, wie Sie die Prompt API mit Bildeingabe verwenden.

Die Prompt API unterstützt die folgenden Eingabetypen:

Audio:
Visuell:
- HTMLImageElement
- SVGImageElement
- HTMLVideoElement (verwendet den Videoframe an der aktuellen Videoposition)
- HTMLCanvasElement
- ImageBitmap
- OffscreenCanvas
- VideoFrame
- Blob
- ImageData

In diesem Snippet wird eine multimodale Sitzung gezeigt, in der zuerst zwei Bilder (ein Bild Blob und ein HTMLCanvasElement) verarbeitet werden und die KI sie vergleicht. Danach kann der Nutzer mit einer Audioaufnahme (als AudioBuffer) antworten.

const session = await LanguageModel.create({
  expectedInputs: [
    { type: "text", languages: ["en"] },
    { type: "audio" },
    { type: "image" },
  ],
  expectedOutputs: [{ type: "text", languages: ["en"] }],
});

const referenceImage = await (await fetch("reference-image.jpeg")).blob();
const userDrawnImage = document.querySelector("canvas");

const response1 = await session.prompt([
  {
    role: "user",
    content: [
      {
        type: "text",
        value:
          "Give a helpful artistic critique of how well the second image matches the first:",
      },
      { type: "image", value: referenceImage },
      { type: "image", value: userDrawnImage },
    ],
  },
]);
console.log(response1);

const audioBuffer = await captureMicrophoneInput({ seconds: 10 });

const response2 = await session.prompt([
  {
    role: "user",
    content: [
      { type: "text", value: "My response to your critique:" },
      { type: "audio", value: audioBuffer },
    ],
  },
]);
console.log(response2);

Nachrichten anhängen

Die Inferenz kann einige Zeit in Anspruch nehmen, insbesondere wenn Sie multimodale Eingaben verwenden. Es kann hilfreich sein, vorab festgelegte Prompts zu senden, um die Sitzung zu füllen, damit das Modell schneller mit der Verarbeitung beginnen kann.

initialPrompts ist zwar beim Erstellen von Sitzungen nützlich, die Methode append() kann jedoch zusätzlich zu den Methoden prompt() oder promptStreaming() verwendet werden, um nach dem Erstellen der Sitzung zusätzliche Kontextaufforderungen zu geben.

Beispiel:

const session = await LanguageModel.create({
  initialPrompts: [
    {
      role: 'system',
      content:
        'You are a skilled analyst who correlates patterns across multiple images.',
    },
  ],
  expectedInputs: [{ type: 'image' }],
});

fileUpload.onchange = async () => {
  await session.append([
    {
      role: 'user',
      content: [
        {
          type: 'text',
          value: `Here's one image. Notes: ${fileNotesInput.value}`,
        },
        { type: 'image', value: fileUpload.files[0] },
      ],
    },
  ]);
};

analyzeButton.onclick = async (e) => {
  analysisResult.textContent = await session.prompt(userQuestionInput.value);
};

Das von append() zurückgegebene Promise wird erfüllt, sobald der Prompt validiert, verarbeitet und an die Sitzung angehängt wurde. Das Promise wird abgelehnt, wenn der Prompt nicht angehängt werden kann.

JSON-Schema übergeben

Fügen Sie das Feld responseConstraint der Methode prompt() oder promptStreaming() hinzu, um ein JSON-Schema als Wert zu übergeben. Anschließend können Sie strukturierte Ausgaben mit der Prompt API verwenden.

Im folgenden Beispiel wird durch das JSON-Schema sichergestellt, dass das Modell mit true oder false antwortet, um zu klassifizieren, ob eine bestimmte Nachricht sich auf Töpferei bezieht.

const session = await LanguageModel.create();

const schema = {
  "type": "boolean"
};

const post = "Mugs and ramen bowls, both a bit smaller than intended, but that
happens with reclaim. Glaze crawled the first time around, but pretty happy
with it after refiring.";

const result = await session.prompt(
  `Is this post about pottery?\n\n${post}`,
  {
    responseConstraint: schema,
  }
);
console.log(JSON.parse(result));
// true

Ihre Implementierung kann ein JSON-Schema oder einen regulären Ausdruck als Teil der an das Modell gesendeten Nachricht enthalten. Dabei wird ein Teil des Eingabekontingents verwendet. Sie können messen, wie viel des Eingabekontingents verwendet wird, indem Sie die Option responseConstraint an session.measureInputUsage() übergeben.

Sie können dieses Verhalten mit der Option omitResponseConstraintInput vermeiden. Wenn Sie das tun, empfehlen wir, dem Prompt eine Anleitung hinzuzufügen:

const result = await session.prompt(`
  Summarize this feedback into a rating between 0-5. Only output a JSON
  object { rating }, with a single property whose value is a number:
  The food was delicious, service was excellent, will recommend.
`, { responseConstraint: schema, omitResponseConstraintInput: true });

Prompt für das Modell erstellen

Sie können das Modell entweder mit der Funktion prompt() oder mit der Funktion promptStreaming() auffordern.

Anfragebasierte Ausgabe

Wenn Sie ein kurzes Ergebnis erwarten, können Sie die Funktion prompt() verwenden, die die Antwort zurückgibt, sobald sie verfügbar ist.

// Start by checking if it's possible to create a session based on the
// availability of the model, and the characteristics of the device.
const available = await LanguageModel.availability({
  expectedInputs: [{type: 'text', languages: ['en']}],
  expectedOutputs: [{type: 'text', languages: ['en']}],
});

if (available !== 'unavailable') {
  const session = await LanguageModel.create();

  // Prompt the model and wait for the whole result to come back.
  const result = await session.prompt('Write me a poem!');
  console.log(result);
}

Gestreamte Ausgabe

Wenn Sie eine längere Antwort erwarten, sollten Sie die Funktion promptStreaming() verwenden. Damit können Sie Teilergebnisse anzeigen, sobald sie vom Modell eingehen. Die Funktion promptStreaming() gibt eine ReadableStream zurück.

const available = await LanguageModel.availability({
  expectedInputs: [{type: 'text', languages: ['en']}],
  expectedOutputs: [{type: 'text', languages: ['en']}],
});
if (available !== 'unavailable') {
  const session = await LanguageModel.create();

  // Prompt the model and stream the result:
  const stream = session.promptStreaming('Write me an extra-long poem!');
  for await (const chunk of stream) {
    console.log(chunk);
  }
}

Aufforderungen beenden

Sowohl prompt() als auch promptStreaming() akzeptieren einen optionalen zweiten Parameter mit einem signal-Feld, mit dem Sie das Ausführen von Prompts beenden können.

const controller = new AbortController();
stopButton.onclick = () => controller.abort();

const result = await session.prompt('Write me a poem!', {
  signal: controller.signal,
});

Sitzungsverwaltung

In jeder Sitzung wird der Kontext der Unterhaltung berücksichtigt. Frühere Interaktionen werden bei zukünftigen Interaktionen berücksichtigt, bis das Kontextfenster der Sitzung voll ist.

Für jede Sitzung gilt eine maximale Anzahl von Tokens, die verarbeitet werden können. So können Sie Ihren Fortschritt in Bezug auf dieses Limit prüfen:

console.log(`${session.inputUsage}/${session.inputQuota}`);

Weitere Informationen zur Sitzungsverwaltung

Sitzung klonen

Um Ressourcen zu sparen, können Sie eine vorhandene Sitzung mit der Funktion clone() kopieren. Dadurch wird eine Kopie der Unterhaltung erstellt, in der der Kontext und der ursprüngliche Prompt beibehalten werden.

Die Funktion clone() akzeptiert ein optionales Optionenobjekt mit dem Feld signal, über das Sie ein AbortSignal übergeben können, um die geklonte Sitzung zu beenden.

const controller = new AbortController();
stopButton.onclick = () => controller.abort();

const clonedSession = await session.clone({
  signal: controller.signal,
});

Sitzung beenden

Rufen Sie destroy() auf, um Ressourcen freizugeben, wenn Sie eine Sitzung nicht mehr benötigen. Wenn eine Sitzung beendet wird, kann sie nicht mehr verwendet werden und alle laufenden Ausführungen werden abgebrochen. Es kann sinnvoll sein, die Sitzung beizubehalten, wenn Sie das Modell häufig auffordern möchten, da das Erstellen einer Sitzung einige Zeit in Anspruch nehmen kann.

await session.prompt(
  "You are a friendly, helpful assistant specialized in clothing choices."
);

session.destroy();

// The promise is rejected with an error explaining that
// the session is destroyed.
await session.prompt(
  "What should I wear today? It is sunny, and I am choosing between a t-shirt
  and a polo."
);

Demos

Wir haben mehrere Demos erstellt, um die vielen Anwendungsfälle für die Prompt API zu veranschaulichen. Die folgenden Demos sind Webanwendungen:

Wenn Sie die Prompt API in Chrome-Erweiterungen testen möchten, installieren Sie die Demoerweiterung. Der Quellcode der Erweiterung ist auf GitHub verfügbar.

Leistungsstrategie

Die Prompt API für das Web wird noch entwickelt. Bis wir diese API entwickelt haben, können Sie sich an unsere Best Practices zur Sitzungsverwaltung halten, um eine optimale Leistung zu erzielen.

Berechtigungsrichtlinie, iFrames und Web Workers

Standardmäßig ist die Prompt API nur für Fenster der obersten Ebene und für ihre Same-Origin-Iframes verfügbar. Der Zugriff auf die API kann mithilfe des allow=""-Attributs der Berechtigungsrichtlinie an ursprungsübergreifende iFrames delegiert werden:

<!--
  The hosting site at https://main.example.com can grant a cross-origin iframe
  at https://cross-origin.example.com/ access to the Prompt API by
  setting the `allow="language-model"` attribute.
-->
<iframe src="https://cross-origin.example.com/" allow="language-model"></iframe>

Die Prompt API ist derzeit nicht in Web Workers verfügbar, da es sehr komplex ist, für jeden Worker ein verantwortliches Dokument zu erstellen, um den Status der Berechtigungsrichtlinie zu prüfen.

Ihr Feedback kann sich direkt darauf auswirken, wie wir zukünftige Versionen dieser API und aller integrierten KI-APIs entwickeln und implementieren.

Wenn Sie Feedback zur Implementierung in Chrome geben möchten, melden Sie einen Fehler oder stellen Sie einen Feature Request.
Sie können Feedback zur API geben, indem Sie einen Kommentar zu einem vorhandenen Problem hinterlassen oder ein neues Problem im GitHub-Repository der Prompt API erstellen.
Am Early-Access-Programm teilnehmen