WebMCP

Alexandra Klepper
Alexandra Klepper

Published: May 18, 2026, Last updated: June 9, 2026

WebMCP 是一项 拟议的网络标准,旨在帮助您为 AI 智能体构建和公开结构化工具。WebMCP 提供 JavaScript 并为 HTML 表单元素添加注释,以便智能体确切了解如何与页面功能互动,从而支持用户体验。这可以显著提高智能体执行的性能和可靠性。

AI 智能体是一项较新的技术。它们可以帮助人类用户更好地完成高度复杂和技术性的任务。WebMCP 可以提高智能体完成任务的准确性,并且可以作为渐进式增强功能添加。

全面解析 Web 扩展程序 Chrome 状态 目的
GitHub 源试用 源试用 查看 实验目的

为什么要使用 WebMCP?

WebMCP 可以通过提供互动规则,帮助您弥合 Web 应用与智能体之间的差距,从而提高效率、可靠性和任务完成度。网站会声明元素的用途,而不是让智能体查看元素(例如按钮或字段)以了解其用途,因此可以正确使用元素

这比执行更可靠,因为执行可能包含许多步骤,并且每个步骤都可能被智能体以不同的方式解读。

网站可以通过定义 tool 来分享明确的用途,例如搜索或购买。工具会在网页上以可见的方式执行,因此用户可以信任任务会按预期完成。这还可以确保您的品牌和以人为本的设计选择保持不变。

WebMCP 支持:

  • 发现:页面向智能体注册工具(例如 checkoutfilter_results)的标准方式。
  • JSON 架构:明确定义输入和预期输出,以减少幻觉或误解。
  • 状态:对当前页面上下文的共同理解,以便智能体了解哪些资源可供实时操作。

我们的目标是构建任何具有智能体功能的浏览器都可以实现并从中受益的 API,以便您的用户可以更轻松地完成任务。您 可以在 GitHub上关注此过程。

使用场景

您可以通过多种方式在 Web 上使用 WebMCP。例如:

  • 帮助客户获得支持 。如果您向客户提供软件,则可能需要复杂的支持流程来解决许多不同的问题。您可以使用 WebMCP 帮助智能体更快地导航到正确的表单,并使用用户提供的信息填写字段。
  • 改进旅行预订 。帮助智能体以更少的步骤预订复杂的、多城市和多乘客的行程。

某些操作可能比较敏感,例如进行购买。您可以添加一个命令,要求用户与确认对话框互动。

实际上,您的工具可以完成以下任务:

  • 填写结构化表单:构建 submit_application 工具,帮助智能体将从与用户的对话中收集的数据正确映射到表单字段。例如,您可以区分字段是需要全名,还是需要单独的姓氏和名字。
  • 在以人为本的界面中支持智能体互动:某些字段是 为人类用户设计的,但智能体可能无法理解。您可以构建一个 date_pick 工具,以便在预订或活动预订中选择复杂的日期和时间。
  • 更快地调试应用:您可以在 开发者设置页面上构建run_diagnostics工具,以便智能体触发修复,否则这些修复会 隐藏在嵌套菜单后面。

您缺少使用场景吗?或者,您是否有想要分享的 WebMCP 想法?加入抢先体验计划 并分享您的反馈。

开始使用

从 Chrome 149 开始加入 WebMCP 源试用 。详细了解如何 开始使用源试用

本地 WebMCP

WebMCP 可作为 Chrome flag 用于本地开发:

  1. 打开 Chrome,然后前往 chrome://flags/#enable-webmcp-testing
  2. 将标志设置为已启用
  3. 重新启动 Chrome 以应用更改。

使用 WebMCP API

您可以使用两个 API 来设置网站工具:

  • 命令式 API:使用标准 JavaScript 定义不同类型的 工具,例如表单输入、导航工具、状态 管理或其他功能。
  • 声明式 API:向标准 HTML 表单添加注释以创建 WebMCP 工具。

限制

虽然 WebMCP 旨在让智能体和人类更轻松地完成复杂任务,但仍存在一些限制:

  • 需要浏览上下文:由于工具调用在 JavaScript 中处理, 因此必须打开浏览器标签页或 WebView 才能提供可见的界面和 浏览器上下文。换句话说,不支持智能体或辅助工具在无头状态下调用工具。
  • 复杂界面的开销更大:如果您的网站非常复杂,您 可能需要重构或添加 JavaScript 来处理应用和界面状态。
  • 工具可发现性:客户端和浏览器必须直接访问网站,才能 知道网站是否具有可调用的工具。

安全与权限

WebMCP API 受来源隔离要求和权限政策的限制。

来源隔离

WebMCP 仅在来源隔离的 文档中可用。这可确保文档的来源在工具的整个生命周期内保持稳定。

如果文档启用了 document.domain(例如,使用 Origin-Agent-Cluster: ?0 HTTP 标头),则 WebMCP API 会被停用。

权限政策

这两个 API 都受 tools 权限政策的限制。 该政策默认设置为 self,允许在顶级和同源上下文中注册工具,并针对跨源 iframe 停用该政策。

如需在跨源 iframe 中允许 WebMCP 工具,请将 allow="tools" 属性添加到 iframe。

演示

以下是一些演示示例,涵盖命令式和声明式实现:

您还可以在 GitHub上查看和探索演示源代码。

使用检查器扩展程序模拟智能体聊天

安装 Model Context Tool Inspector Extension ,以便试用智能体,并了解 WebMCP 工具在实时演示或您自己的 应用中的工作方式。使用自然语言提示来确定智能体是否按预期与 WebMCP 工具互动。

借助该扩展程序,您可以:

  • 通过监控 WebMCP API,查看页面上注册了哪些工具。
  • 手动调用工具并执行函数。
  • 验证 JSON 架构是否定义正确,以及浏览器是否可以按照工具的预期解析数据。
  • 查看工具返回的结构化输出或错误消息,确保它们编写清晰且格式正确,以便智能体能够理解。

使用自然语言与智能体交谈,看看它是否可以正确识别和调用相应的 WebMCP 工具。您的提示默认发送到 gemini-3-flash-preview 模型。

参与互动并分享反馈

WebMCP 正在积极讨论中,将来可能会发生变化。如果您试用了这些 API 并有反馈,我们非常乐意倾听。