WebMCP

Alexandra Klepper
Alexandra Klepper

Opublikowano: 18 maja 2026 r., ostatnia aktualizacja: 9 czerwca 2026 r.

WebMCP to proponowany standard internetowy, który ułatwia tworzenie i udostępnianie narzędzi strukturalnych dla agentów AI . WebMCP udostępnia JavaScript i dodaje adnotacje do elementów formularza HTML, dzięki czemu agenty dokładnie wiedzą, jak wchodzić w interakcje z funkcjami strony, aby zapewnić użytkownikom jak najlepsze wrażenia. Może to znacznie zwiększyć wydajność i niezawodność działania agenta.

Agenty AI to nowa technologia. Mogą one pomagać użytkownikom w wykonywaniu złożonych i technicznych zadań. WebMCP zapewnia większą dokładność wykonywania zadań przez agenta i można go dodać jako progresywne ulepszenie.

Wyjaśnienie Sieć Rozszerzenia Stan Chrome Intencja
GitHub Wersja próbna origin Testowanie origin Wyświetl Intencja eksperymentu

Dlaczego WebMCP?

WebMCP może pomóc Ci wypełnić lukę między aplikacjami internetowymi a agentami, zwiększając wydajność, niezawodność i skuteczność wykonywania zadań dzięki udostępnianiu reguł interakcji. Zamiast analizować element, taki jak przycisk lub pole, aby zrozumieć jego przeznaczenie, witryna deklaruje jego przeznaczenie, dzięki czemu jest on używany prawidłowo.

Jest to bardziej niezawodne niż działanie, które może obejmować wiele kroków, a każdy z nich może być interpretowany przez agenta na różne sposoby.

Witryny mogą udostępniać wyraźne przeznaczenie, np. wyszukiwanie lub zakupy, przez zdefiniowanie tool. Narzędzia działają na stronie w widoczny sposób, dzięki czemu użytkownicy mają pewność, że zadania są wykonywane zgodnie z oczekiwaniami. Pozwala to też zachować spójność marki i decyzji projektowych skoncentrowanych na użytkowniku.

WebMCP obsługuje:

  • Wykrywanie: standardowy sposób rejestrowania narzędzi przez strony u agentów, np. checkout lub filter_results.
  • Schematy JSON: wyraźne definicje danych wejściowych i oczekiwanych danych wyjściowych, które zmniejszają ryzyko halucynacji lub nieporozumień.
  • Stan: wspólne rozumienie bieżącego kontekstu strony, dzięki czemu agent wie, jakie zasoby są dostępne do działania w czasie rzeczywistym.

Naszym celem jest tworzenie interfejsów API, które mogą być implementowane i wykorzystywane przez dowolną przeglądarkę z funkcjami agenta, aby użytkownicy mogli łatwiej wykonywać zadania. Możesz śledzić ten proces na GitHub.

Przypadki użycia

WebMCP można wykorzystać w internecie na wiele sposobów. Na przykład:

  • Pomaganie klientom w uzyskiwaniu pomocy. Jeśli udostępniasz klientom oprogramowanie, możesz mieć złożony proces pomocy, który odpowiada na wiele różnych pytań. Możesz użyć WebMCP, aby pomóc agentowi szybciej przejść do odpowiedniego formularza i wypełnić pola informacjami podanymi przez użytkownika.
  • Usprawnianie rezerwacji podróży. Pomóż agentom rezerwować złożone podróże obejmujące wiele miast i pasażerów w mniejszej liczbie kroków.

Niektóre działania mogą być poufne, np. dokonanie zakupu. Możesz dodać polecenie, aby poprosić użytkownika o interakcję z oknem potwierdzenia.

W praktyce Twoje narzędzia mogą wykonywać te zadania:

  • Wypełnianie formularzy strukturalnych: utwórz narzędzie submit_application, które pomoże agentom prawidłowo mapować dane zebrane podczas rozmowy z użytkownikiem na pola formularza. Możesz na przykład rozróżnić, czy pole wymaga pełnej nazwy, czy osobno imienia i nazwiska.
  • Obsługa interakcji agenta w interfejsach zaprojektowanych z myślą o użytkownikach: niektóre pola są przeznaczone dla użytkowników, ale mogą nie być zrozumiałe dla agentów. Możesz utworzyć narzędzie date_pick, które umożliwia złożony wybór daty i godziny podczas rezerwacji lub rezerwacji wydarzenia.
  • Szybsze debugowanie aplikacji: możesz utworzyć narzędzie run_diagnostics na stronie ustawień dewelopera, aby agent mógł wywoływać poprawki, które w przeciwnym razie byłyby ukryte w zagnieżdżonych menu.

Brakuje Twojego przypadku użycia? A może masz pomysł, którym chcesz się podzielić w związku z WebMCP? Dołącz do programu wczesnego dostępu i prześlij opinię.

Rozpocznij

Dołącz do testowania origin WebMCP w Chrome 149. Dowiedz się więcej o pierwszych krokach z okresami próbnymi .

Lokalny WebMCP

WebMCP jest dostępny jako flaga Chrome na potrzeby lokalnego tworzenia:

  1. Otwórz Chrome i przejdź do chrome://flags/#enable-webmcp-testing.
  2. Ustaw flagę na Włączone.
  3. Uruchom ponownie Chrome, aby zastosować zmiany.

Korzystanie z interfejsów WebMCP API

Do konfigurowania narzędzi witryny możesz używać 2 interfejsów API:

  • Imperatywny interfejs API: definiuj różne typy narzędzi za pomocą standardowego JavaScriptu, np. wprowadzanie danych w formularzu, narzędzia nawigacyjne, zarządzanie stanem lub inne funkcje.
  • Deklaratywny interfejs API: dodaj adnotacje do standardowych formularzy HTML, aby utworzyć narzędzie WebMCP.

Ograniczenia

Chociaż WebMCP ma na celu uproszczenie złożonych zadań dla agentów i ludzi, ma pewne ograniczenia:

  • Wymagany kontekst przeglądania: ponieważ wywołania narzędzi są obsługiwane w JavaScript, musi być otwarta karta przeglądarki lub widok internetowy, aby zapewnić widoczny interfejs i kontekst przeglądarki. Innymi słowy, nie ma obsługi agentów ani narzędzi wspomagających, które wywołują narzędzia w stanie bez interfejsu graficznego.
  • Większy narzut w przypadku złożonych interfejsów: jeśli Twoja witryna jest bardzo złożona, prawdopodobnie musisz przeprowadzić refaktoryzację lub dodać JavaScript, aby obsługiwać stan aplikacji i interfejsu.
  • Wykrywalność narzędzi: aby sprawdzić, czy witryna ma narzędzia, które można wywołać, klienci i przeglądarki muszą odwiedzić ją bezpośrednio.

Bezpieczeństwo i uprawnienia

Dostęp do interfejsów WebMCP API jest ograniczony zarówno przez wymagania dotyczące izolacji źródła, jak i przez zasady dotyczące uprawnień.

Izolacja źródła

WebMCP jest dostępny tylko w dokumentach izolowanych od źródła. Dzięki temu źródło dokumentu pozostaje stabilne przez cały okres istnienia narzędzia.

Jeśli w dokumencie jest włączona funkcja document.domain (np. za pomocą nagłówka HTTP Origin-Agent-Cluster: ?0), interfejsy WebMCP API są wyłączone.

Zasady dotyczące uprawnień

Oba interfejsy API są ograniczone przez tools zasady dotyczące uprawnień. Domyślnie zasada ma wartość self, która umożliwia rejestrację narzędzi w kontekstach najwyższego poziomu i tego samego źródła oraz wyłącza ją w przypadku elementów iframe z innych źródeł.

Aby zezwolić na narzędzia WebMCP w elemencie iframe z innego źródła, dodaj do elementu iframe allow="tools" atrybut.

Prezentacja

Dostępne są przykłady prezentacji obejmujące implementacje imperatywne i deklaratywne:

Możesz też przejrzeć i zbadać kod źródłowy prezentacji na GitHub.

Imitowanie czatu z agentem za pomocą rozszerzenia inspektora

Zainstaluj rozszerzenie Model Context Tool Inspector aby eksperymentować z agentem i zobaczyć, jak działają narzędzia WebMCP w prezentacjach na żywo lub w Twoich aplikacjach. Używaj promptów w języku naturalnym, aby sprawdzić, czy agent wchodzi w interakcje z narzędziami WebMCP zgodnie z oczekiwaniami.

Dzięki rozszerzeniu możesz:

  • Sprawdzić, które narzędzia są zarejestrowane na stronie, monitorując interfejs WebMCP API.
  • Ręcznie wywoływać narzędzia i wykonywać funkcje.
  • Sprawdzić, czy schemat JSON jest prawidłowo zdefiniowany i czy przeglądarka może analizować dane zgodnie z oczekiwaniami narzędzia.
  • Wyświetlać strukturalne dane wyjściowe lub komunikaty o błędach zwracane przez narzędzie, aby upewnić się, że są one napisane jasno i prawidłowo sformatowane, dzięki czemu agent może je zrozumieć.

Rozmawiaj z agentem w języku naturalnym, aby sprawdzić, czy potrafi prawidłowo zidentyfikować i wywołać odpowiednie narzędzia WebMCP. Domyślnie prompty są wysyłane do modelu gemini-3-flash-preview.

Zaangażuj się i prześlij opinię

WebMCP jest obecnie przedmiotem dyskusji i w przyszłości może ulec zmianie. Jeśli wypróbujesz te interfejsy API i masz jakieś uwagi, chętnie je poznamy.