发布时间:2026 年 5 月 19 日
智能体正在改变各行各业的开发方式,而这种转变在 Web 领域尤为迅速。它正在重新定义我们构建的内容、构建的方式以及构建者。随着我们进入智能体 Web 时代,我们看到一种转变正在弥合复杂开发者工作流程、底层平台功能和日常用户体验之间的差距。
在 2026 年 Google I/O 大会上,我们公布了对这个时代的愿景。这些想法将 Web 生态系统的三个核心领域联系起来:让 AI 智能体能够通过新功能 构建网站并与之互动 ;突破 Web 界面和性能的界限 ;以及将浏览器转变为 功能强大、主动出击的助理 ,让 Chrome 中的 Gemini 为日常用户提供服务。 通过将高效的内置 AI 模型直接集成到浏览器中,并将自动浏览等强大的自动化工具引入 Chrome,我们让每个人都能更智能、更快速、更轻松地使用 Web。
以下是我们在 2026 年 Google I/O 大会上分享的 15 项重大更新,可帮助您在智能体 Web 时代蓬勃发展。
让 AI 智能体能够为 Web 提供服务
智能体正在改变我们与软件的互动方式,我们认为 Web 必须能够引导它们。我们推出了强大的新功能和工具,例如 WebMCP 和 Modern Web Guidance,让您能够更清晰、更快速地打造现代 Web 体验。我们还为您提供了 AI 辅助工具,让您能够比以往更快、更准确地构建、调试和优化代码。
1. WebMCP:将您的网站转变为智能体工具包
我们率先向您展示 WebMCP, 这是一个拟议的开放 Web 标准,可让您将 JavaScript 函数和 HTML 表单等结构化工具公开给基于浏览器的智能体。通过定义这些工具, 您可以准确地指示智能体如何以及在何处与您的网站互动。 效果如何呢?智能体现在可以调用机器友好的函数,在几秒钟内完成 复杂的任务,同时具有更高的可靠性、准确性和 个性化程度。假设用户正在计划一次多城市度假。他们无需观看智能体点击浏览旅游表单,而是可以授权智能体直接查询后端 API,以便立即构建个性化的天气优化行程,供他们批准。
实验性 WebMCP 源试用版将于 Chrome 149 中推出。Chrome 中的 Gemini 将很快支持 WebMCP API。我们已经看到全球消费品牌正在尝试使用 WebMCP,以便为用户打造更令人愉悦和更具吸引力的体验。

2. Modern Web Guidance:指导编码智能体为现代 Web 构建的蓝图
Modern Web Guidance 现已推出 早期预览版,它是一组常青且经过专家审核的技能,可指导 您的编码智能体处理许多常见用例,以便构建更易于访问、性能更高且更安全的现代 Web 体验。它 直接与 Baseline 集成,让您能够 专注于要构建的内容,而您的工具会自动找出 要在所选 Baseline 目标中使用的正确功能和回退。 您可以在 Google Antigravity 中一键安装,也可以通过 npx 或作为一 个编码智能体中的扩展程序安装。Modern Web Guidance 功能支持数十个最新功能的 100 多个用例,并定期添加持续更新。
3. 使用面向智能体的 Chrome 开发者工具自动执行调试
使用面向智能体的 Chrome 开发者工具来扩缩工作流程,该工具可提供实时验证、调试和优化代码的可见性。通过向 智能体提供对开发者工具功能(例如控制台日志、 网络流量和无障碍树)的直接访问权限,智能体无需人工监督即可验证和自动修复。 面向智能体的 Chrome 开发者工具现已面向 Antigravity 和 20 多个其他编码智能体推出。
4. 借助 Chrome 开发者工具中的 AI 辅助调试功能,深入了解情况
Chrome 开发者工具中的 AI 辅助功能 现在可以访问 Lighthouse 数据,并且可以自动搜索上下文 以便回答比以前更多的开放式问题。 此外,小部件还可让您全面了解 Gemini 的推理过程,从而帮助您进行调试。
5. 无需服务器、预算和繁文缛节:借助内置 AI 解锁 AI 功能
内置 AI 完全在浏览器中运行,让您能够部署个性化、主动出击的功能,这些功能在服务器上成本高昂。无需支付令牌费用和其他障碍,完全专注于独特的用户价值。最重要的是,浏览器会在各个网站之间管理和共享优化后的模型,让更多用户能够在 Web 上享受 AI 体验。
为了帮助您构建这些顺畅的 AI 增强功能,我们正在扩展 Web AI 工具包:
- Prompt API 稳定版: Chrome 148 使用具有多模态输入和结构化输出的基础模型, 提供丰富的体验、可靠的 JSON 以实现无缝集成,并支持 更多语言。
- Gemma 197M: 这种超高效的专家模型可以透明地为 summarizer等特定于任务的 API 提供支持,自动将您的功能扩缩到 更广泛的设备。
探索完整的内置 AI 套件,包括我们 现有的 Translator 和 Language Detector API,并 加入 Early Preview Program 来测试即将推出的 API。
突破 Web 界面和性能的界限
我们正在开发下一代平台功能,这些功能将继续模糊 Web 应用和原生应用之间的界限。新的声明式 API(例如 HTML-in-Canvas 和 Declarative Partial Updates)可为您处理复杂的渲染和性能任务,让您能够比以往更轻松地在 Web 上构建美观、现代、高保真、高性能和互动式体验。
6. HTML-in-Canvas 和元素范围内的视图转换:借助下一代界面打破界限
新的 HTML-in-Canvas API 和 元素范围内的视图转换功能 可实现以前无法实现的界面,从而为 Web 带来高保真、类似应用的 互动性。借助 HTML-in-Canvas API,您可以将真实的 DOM 元素直接集成到具有 WebGL 和 WebGPU 的画布中,以构建一个 沉浸式 3D 体验 ,该体验可搜索、可访问、可原生翻译,并与内置浏览器功能 无缝互动。将此功能与视图转换(例如元素范围内的视图转换,现已在 Chrome 147 中提供;以及双阶段转换,目前正在测试中)相结合,以创建分层界面动画效果,并为中间状态添加动画效果,而不会阻止页面互动。通过将复杂的互动转换为声明式 API,我们默认提供高保真性能。 HTML-in-Canvas API 源试用版 现已推出。
7. 性能和界面优势:适用于 SPA 的 Core Web Vitals 等
Chrome 正在启用新的方式来提升现代类似应用的 Web 体验的性能。新更新包括 Soft Navigations API, 该 API 将在即将发布的 Chrome 版本中提供,可将 Core Web Vitals 测量引入单页 应用。我们还推出了新的 Declarative Partial Updates 原语,将原生无序 HTML 更新引入平台,并推出了新的流式 API,以便更轻松地将 HTML 插入页面,而无需进行大量 DOM 操作。这些 API 现已可供测试。
8. 使用 Immediate UI 模式实现身份验证现代化
作为身份更新的一部分,Immediate UI 模式将密码和通行密钥统一到单个浏览器管理的登录流程中。当用户点击您网站上的“登录”时,Chrome 会自动显示可用的凭据,从而允许使用已保存的密码或通行密钥进行无缝身份验证。请参阅 Immediate UI 模式实现指南,开始使用。
9. 使用真实流量数据规划 Baseline 目标
无需再使用导出的 TSV 文件来整理数据!使用新的 Baseline Checker 工具直接连接到更新后的 Google Analytics API,并准确了解实际用户中支持现代功能的百分比。选择 Baseline 目标,并自信地向用户发布最新功能,同时了解何时使用回退。
借助 Chrome 中的 Gemini 提升浏览体验
Chrome 中的 Gemini 现已在桌面设备、iOS 设备和 Android 设备上推出,我们为用户提供了强大的新方式来浏览、创作和完成任务。从使用自动浏览功能自动执行复杂的多步骤任务,到使用光标或语音进行直观的多模态互动,Chrome 中的 Gemini 可让用户直接使用强大的生产力工具。
10. 适用于 Android 的 Chrome 中的 Gemini:手机上的浏览助理。
我们将在 6 月推出适用于 Android 的 Chrome 中的 Gemini,将其设计为您的个人浏览助理,帮助您更好地了解 Web 上的内容。借助它,您可以总结长篇文章、提出具体问题,并获得详细的说明,而无需切换应用。 除了回答问题之外,它还可以作为多功能的生产力工具,与 Google 日历、Keep 和 Gmail 等 Google 应用关联,帮助您快速完成任务。借助 Personal Intelligence, 如果您选择关联 Gmail 和 Google 相册等应用,这个安全且 具有上下文感知能力的浏览助理甚至可以根据您的独特兴趣、爱好等提供 量身定制的回答。
11. 使用自动浏览功能处理繁琐的任务
Android 版自动浏览功能现已在桌面设备上提供, 可让您充分利用 Chrome 中的 Gemini,自动执行数字杂务 以便专注于更重要的 任务。借助自动浏览功能,您可以轻松完成从预约预订到派对策划、查找库存商品等任务,所有这些都可以在 Android 手机上完成。例如,如果您即将前往观看喜剧表演,但忘记预订停车位,自动浏览功能可以帮您解决这个问题。只需询问 Chrome 中的 Gemini,它就会从您的门票中收集活动详情,为您找到停车位。
在桌面设备上,我们将在未来几个月内将自动浏览功能与 Gemini Spark 集成,以便您的全天候专属 AI 智能体能够代表您在浏览器中执行操作。
12. 使用 Nano Banana 随时随地转换图片
借助 Nano Banana,您可以在 Android 设备上浏览网页时即时创建或自定义图片。只需在学习时要求 Chrome 中的 Gemini“将此页面转换为信息丰富的信息图”,或在浏览公寓时要求“更改图片以包含现代客厅必需品”。
13. Chrome 中的技能:将最佳 AI 提示转换为一键式工具
借助 Chrome 中的技能,您可以保存和重复使用桌面设备上 Chrome 中的 Gemini 中最有用的 AI 提示。只需保存一次多标签页工作流程(例如在购物时生成并排规格比较,或扫描长文档以查找关键信息),然后随时一键运行。
14. 从屏幕中选择内容以提示 Chrome 中的 Gemini
您现在可以使用鼠标指针向 Chrome 中的 Gemini 询问您正在查看的网页的特定部分,而无需准确描述您的意思。例如,您可以选择页面上的两种产品,并立即比较其主要功能。或者,如果您想使用 Nano Banana 编辑图片,您可以准确选择要更改的图片部分
15. 在整个 Web 上使用语音
很快,您就可以使用语音在桌面设备上的 Chrome 中输入网站内容。借助语音,您可以更轻松、更自然地完成草拟评论、填写表单中的长字段或撰写电子邮件等操作。这将使用 Gemini 模型来清理您的转录内容(删除“嗯”和“啊”等语气词,并使其符合上下文,同时保留您的语音),或者按照您的要求填写字段。
后续步骤
智能体 Web 的转型正在我们眼前展开。通过弥合强大的底层 AI 功能与日常 Web 开发之间的差距,我们正在消除历史上阻碍和限制创新的摩擦。
我们正在从需要您完成所有繁重工作的 Web 转向主动为您服务的 Web。 无论您是希望与基于浏览器的智能体无缝集成,突破网页功能的绝对视觉限制,还是仅仅希望简化自己的调试工作流程,我们都将为您提供构建 Web 未来的工具。
请访问 developer.chrome.com和 web.dev,探索完整指南和技术深入分析。我们希望了解您使用这些新 功能构建的内容。因此,请分享您的项目,并务必通过 X、 LinkedIn和 YouTube与我们联系。
下次 Google I/O 大会再见!