WebMCP

Alexandra Klepper
Alexandra Klepper

发布时间:2026 年 5 月 18 日

WebMCP 是一项拟议的 Web 标准,可帮助您为 AI 代理构建和公开结构化工具。WebMCP 提供 JavaScript 并注释 HTML 表单元素,以便代理确切了解如何与网页功能互动,从而支持用户体验。这可以显著提高代理执行器的性能和可靠性。

AI 智能体是一项较新的技术。它们可以帮助人类用户更好地完成高度复杂的技术性任务。WebMCP 在完成智能体任务方面具有更高的准确性,可以作为渐进增强功能添加。

为什么选择 WebMCP?

WebMCP 可以通过提供互动规则,帮助您弥合 Web 应用与智能体之间的差距,从而提高效率、可靠性和任务完成度。网站会声明元素(例如按钮或字段)的用途,以便正确使用该元素,而无需代理审核元素来了解其用途

这比促动更可靠,因为促动可能包含多个步骤,并且每个步骤都可能被代理以不同的方式解读。

网站可以通过定义 tool 来分享明确的用途,例如搜索或购买。工具会在网页上以可见方式执行,因此用户可以放心地认为任务会按预期完成。这样一来,您的品牌和以人为本的设计选择也会保持不变。

WebMCP 支持:

  • 发现:网页向代理(例如 checkoutfilter_results)注册工具的标准方式。
  • JSON 架构:明确定义输入和预期输出,以减少幻觉或误解。
  • 状态:对当前网页上下文的共同理解,以便智能体了解哪些资源可用于实时采取行动。

我们的目标是构建任何具有智能体功能的浏览器都可以实现并从中受益的 API,以便您的用户更轻松地完成任务。您可以在 GitHub 上查看此流程。

使用场景

您可以通过多种方式在网络上使用 WebMCP。例如:

  • 帮助客户获得支持。如果您向客户提供软件,则可能需要复杂的支持流程来解决各种不同的问题。您可以使用 WebMCP 帮助客服人员更快地找到正确的表单,并使用用户提供的信息填写字段。
  • 改进旅行预订。帮助客服人员以更少的步骤预订复杂的多城市和多乘客行程。

某些操作可能属于敏感操作,例如进行购买交易。您可以添加一条命令,请求用户通过确认对话框进行互动。

从实际意义上讲,您的工具可以完成以下任务:

  • 填写结构化表单:构建一个 submit_application 工具,帮助客服人员将从与用户的对话中收集的数据正确映射到表单字段。例如,您可以区分某个字段是需要全名,还是需要单独的名字和姓氏。
  • 以人为本的界面中的支持代理互动:某些字段是为人类用户设计的,但代理可能无法理解。您可以构建一个 date_pick 工具,以便在预订或活动预订中选择复杂的日期和时间。
  • 更快速的应用调试:您可以在开发者设置页面上构建 run_diagnostics 工具,以便代理触发修复,否则这些修复会隐藏在嵌套菜单后面。

您的使用场景是否未列出?或者,您是否有想要分享的 WebMCP 创意?加入抢先试用计划并分享您的反馈。

开始使用

WebMCP 可作为 Chrome flag 用于本地开发。它将在 Chrome 149 中通过源试用提供。

如需在本地启用 WebMCP,请执行以下操作:

  1. 打开 Chrome,然后前往 chrome://flags/#enable-webmcp-testing
  2. 将标志设置为已启用
  3. 重新启动 Chrome 以应用所做的更改。

使用 WebMCP API

您可以使用以下两种 API 来设置网站工具:

  • 命令式 API:使用标准 JavaScript 定义不同类型的工具,例如表单输入、导航工具、状态管理或其他功能。
  • 声明性 API:向标准 HTML 表单添加注释以创建 WebMCP 工具。

限制

虽然 WebMCP 旨在让代理和人类更轻松地完成复杂任务,但仍存在一些限制:

  • 需要浏览上下文:由于工具调用是在 JavaScript 中处理的,因此必须打开浏览器标签页或 WebView,以提供可见的界面和浏览器上下文。换句话说,不支持代理或辅助工具在无头状态下调用工具。
  • 复杂界面的开销更大:如果您的网站非常复杂,您可能需要重构或添加 JavaScript 来处理应用和界面状态。
  • 工具可发现性:客户端和浏览器必须直接访问网站,才能知道该网站是否具有可调用的工具。

“权限”政策

这两个 API 均受 tools Permissions Policy 控制。此政策的默认值为 self,表示允许在顶级和同源上下文中注册工具,并针对跨源 iframe 停用工具注册。

如需允许跨源 iframe 中的 WebMCP 工具,请向 iframe 添加 allow="tools" 属性。

演示

以下是一些涵盖命令式和声明式实现的演示示例:

您还可以在 GitHub 上查看和探索演示源代码。

使用检查器扩展程序模拟客服人员聊天

安装模型上下文工具检查器扩展程序,以便在实时演示或您自己的应用中试用智能体并了解 WebMCP 工具的运作方式。使用自然语言提示来确定智能体是否按预期与 WebMCP 工具互动。

借助该扩展服务,您可以:

  • 通过监控 navigator.modelContext API,查看哪些工具已在网页上注册。
  • 手动调用工具和执行函数。
  • 验证您的 JSON 架构是否已正确定义,以及浏览器是否可以按照该工具的预期解析数据。
  • 查看工具返回的结构化输出或错误消息,确保其内容清晰且格式正确,以便智能体能够理解。

使用自然语言与智能体对话,看看它是否能正确识别并调用相应的 WebMCP 工具。默认情况下,您的提示会发送给 gemini-3-flash-preview 模型。

互动和分享反馈

WebMCP 正在积极讨论中,将来可能会发生变化。如果您尝试使用这些 API 并有反馈意见,欢迎随时告诉我们。