Google I/O 2026 推出的 15 项更新:利用 Chrome 中的新功能、工具和特性赋能自主型 Web

发布时间:2026 年 5 月 19 日

智能体正在改变各行各业的开发方式,而这种转变在 Web 领域尤为迅速。它正在重新定义我们构建的内容、构建的方式以及构建者。随着我们进入智能体 Web 时代,我们看到一种转变正在弥合复杂开发者工作流、底层平台功能和日常用户体验之间的差距。

在 2026 年 Google I/O 大会上,我们揭示了这一时代的愿景。这些理念将 Web 生态系统的三个核心领域联系起来:让 AI 智能体能够通过新功能构建网站并与之互动,突破 Web 界面和性能的界限,以及将浏览器转变为面向日常用户的强大主动式助理 (通过 Chrome 中的 Gemini 实现)。通过将高效的内置 AI 模型直接集成到浏览器中,并将自动浏览等强大的自动化工具引入 Chrome,我们让每个人都能更智能、更快速、更轻松地使用 Web。

以下是我们在 2026 年 Google I/O 大会上分享的 15 项重大更新,可帮助您在智能体 Web 时代构建和发展。

让 AI 智能体能够使用 Web

智能体正在改变我们与软件的互动方式,我们认为 Web 必须能够引导它们。我们推出了强大的新功能和工具,例如 WebMCP 和 Modern Web Guidance,让您能够更清晰、更快速地构建现代 Web 体验。我们还为您提供了 AI 辅助工具,让您能够比以往更快、更准确地构建、调试和优化代码。

1. WebMCP:将您的网站转变为智能体工具包

我们率先向您展示 WebMCP, 这是一个拟议的开放 Web 标准,可让您将 JavaScript 函数和 HTML 表单等结构化工具公开给基于浏览器的智能体。通过定义这些工具, 您可以准确地指示代理如何以及在何处与您的网站互动。效果如何呢?智能体现在可以调用机器友好的函数,在几秒钟内完成复杂的任务,同时具有更高的可靠性、准确性和个性化程度。假设用户正在计划一次多城市度假。他们无需观看智能体点击浏览旅行表单,而是可以授权智能体直接查询后端 API,立即构建个性化的天气优化行程,供他们批准。

实验性 WebMCP 源试用版将于 Chrome 149 中推出。Chrome 中的 Gemini 即将支持 WebMCP API。我们已经看到全球消费品牌正在尝试使用 WebMCP,以便为用户打造更令人愉悦和更具吸引力的体验。

Expedia、Booking.com、Shopify、Credit Karma、TurboTax、Redfin、Etsy、Instacart、Target 徽标

2. Modern Web Guidance:指导编码智能体为现代 Web 构建的蓝图

Modern Web Guidance 现已推出 早期预览版,它是一组常青且经过专家验证的技能,可指导 您的编码智能体处理许多常见用例,以构建最易于访问、性能最佳且最安全的现代 Web 体验。它 直接与 Baseline 集成,让您 专注于要构建的内容,而您的工具会自动找出 要在所选 Baseline 目标中使用的正确功能和回退。 只需在 Google Antigravity 中点击一下即可安装,也可以通过 npx 或作为编码智能体中的 扩展程序安装。Modern Web Guidance 支持数十个最新功能的 100 多个用例,并定期添加持续更新。

3. 利用 Chrome 开发者工具实现智能体调试自动化

利用 Chrome 开发者工具实现智能体工作流扩缩,该工具可提供 实时验证、调试和优化代码的可视性。通过为 智能体提供对开发者工具功能(例如控制台日志、 网络流量和无障碍树)的直接访问权限,它们无需人工监督即可验证和自动修复。 Chrome 开发者工具实现智能体现已面向 Antigravity 和 20 多个其他编码智能体推出。

一张合成图,显示了性能的提升。
LY Corporation 使用 Chrome 开发者工具实现智能体构建了基于 AI 的自动化性能 审核系统,将人工分析减少了 96-98%,并为每个团队提供了按需审核 报告。

4. 利用 Chrome 开发者工具中的 AI 辅助调试功能深入了解情况

Chrome 开发者工具中的 AI 辅助功能 现在可以访问 Lighthouse 数据,并且可以自动搜索上下文 回答比以前更多的开放式问题。 此外,小部件还可让您全面了解 Gemini 的推理过程,从而帮助您进行调试。

Chrome 开发者工具中的 AI 辅助功能和互动式小部件可大幅降低性能调试的复杂性,同时实现无缝的人机协作。

5. 跳过服务器、预算和繁文缛节:利用内置 AI 解锁 AI 功能

内置 AI 完全在浏览器中运行,让您能够部署在服务器上成本过高的个性化主动式功能。跳过令牌费用和其他障碍,完全专注于独特的用户价值。最重要的是,浏览器可以跨网站管理和共享优化后的模型,让更多用户能够在 Web 上享受 AI 体验。

为了帮助您构建这些顺畅的 AI 增强功能,我们正在扩展 Web AI 工具包:

  • Prompt API 稳定版: Chrome 148 使用 Gemini Nano,具有多模态输入和结构化输出, 可提供丰富的体验、可靠的 JSON 实现无缝集成,并支持 更多语言。
  • Gemma 197M: 这种超高效的专家模型可以透明地为 summarizer等特定于任务的 API 提供支持,自动将您的功能扩缩到 更广泛的设备。

探索完整的内置 AI 套件,包括我们 现有的 Translator 和 Language Detector API,并 加入 Early Preview 试用计划 以测试即将推出的 API。

Trip.com:使用内置 AI 在设备本地生成个性化的旅行摘要, 无需服务器开销,并且可以无限次查询, 无需担心预算问题。

突破 Web 界面和性能的界限

我们正在开发下一代平台功能,这些功能将继续模糊 Web 应用与原生应用之间的界限。新的声明式 API(例如 HTML-in-Canvas 和声明式部分更新)可为您处理复杂的渲染和性能任务,让您比以往更轻松地在 Web 上构建美观、现代、高保真、高性能和互动式体验。

6. HTML-in-Canvas 和元素范围内的视图转换:利用下一代界面打破界限

新的 HTML-in-Canvas API元素范围内的视图转换 实现了以前无法实现的界面,为 Web 带来了高保真、类似应用的 互动性。借助 HTML-in-Canvas API,您可以将真实的 DOM 元素直接集成到具有 WebGL 和 WebGPU 的画布中,以构建一个 沉浸式 3D 体验 ,该体验可搜索、可访问、可原生翻译,并与内置浏览器功能 无缝互动。将其与视图转换(例如元素范围内的视图转换,现已在 Chrome 147 中提供;以及双阶段转换,目前正在测试中)相结合,以创建分层界面动画并为中间状态添加动画效果,而不会阻止页面互动。通过将复杂的互动转换为声明式 API,我们默认提供高保真性能。 HTML-in-Canvas API 源试用版 现已推出。

借助 HTML-in-Canvas API,您现在可以将 HTML 元素和 CSS 样式组合到高保真、多维环境中,以创建新的创意布局和效果。

7. 性能和界面优势:适用于 SPA 的 Core Web Vitals 等

Chrome 正在启用新的方式来提升现代类似应用的 Web 体验的性能。新更新包括 Soft Navigations API, 该 API 将在即将发布的 Chrome 版本中提供,可将 Core Web Vitals 测量引入单页 应用。我们还推出了新的 声明式部分更新 基元,将原生无序 HTML 更新引入平台,并推出了新的流式 API,让您能够更轻松地将 HTML 插入页面,而无需进行大量的 DOM 操作。这些 API 现已可供测试。

8. 利用 Immediate UI 模式实现身份验证现代化

作为身份更新的一部分,Immediate UI 模式将密码和通行密钥统一到单个浏览器管理的登录流程中。当用户点击您网站上的“登录”时,Chrome 会自动显示可用的凭据,从而允许使用已保存的密码或通行密钥进行无缝身份验证。请参阅 Immediate UI 模式实现指南,开始使用。

9. 利用真实路况数据规划 Baseline 目标

无需再使用导出的 TSV 文件来整理数据!使用新的 Baseline Checker 工具直接连接到更新后的 Google Analytics API,准确了解实际用户中支持现代功能的百分比。选择 Baseline 目标,自信地向用户发布最新功能,同时了解何时使用回退。


利用 Chrome 中的 Gemini 提升浏览体验

借助桌面版、iOS 版和 Android 版 Chrome 中的 Gemini,我们为用户提供了强大的新方式来浏览、创作和完成任务。从使用自动浏览功能自动执行复杂的多步骤任务,到使用光标或语音进行直观的多模态互动,Chrome 中的 Gemini 可让用户轻松获得强大的生产力。

10. Android 版 Chrome 中的 Gemini:手机上的浏览助理。

Android 版 Chrome 中的 Gemini 将于 6 月推出,旨在成为您的个人浏览助理,帮助您更好地了解 Web 上的内容。借助它,您可以总结长篇文章、提出具体问题并获得详细说明,而无需切换应用。 除了回答问题之外,它还充当多功能效率提升工具,可与 Google 应用(例如日历、Keep 和 Gmail)关联,帮助您快速完成任务。借助 个性化智能服务, 如果您选择关联 Gmail 和 Google 相册等应用,这个安全且具有上下文感知能力的浏览助理甚至可以根据您的独特兴趣、爱好等提供量身定制的回答。

Chrome 中的 Gemini 会将食谱配料添加到 Keep 中。

11. 使用自动浏览功能处理繁琐的任务

Android 版自动浏览功能现已在桌面设备上提供, 可让您自动执行数字杂务 ,从而充分利用 Chrome 中的 Gemini ,以便专注于更重要的 任务。借助自动浏览功能,您可以轻松完成从预约到派对策划、查找有货商品等任务,所有这些都可以在 Android 手机上完成。例如,如果您即将前往观看喜剧表演,但忘记预订停车位,自动浏览功能可以帮您解决这个问题。只需问问 Chrome 中的 Gemini,它就会从您的门票中收集活动详细信息,为您找到停车位。

在桌面设备上,我们将在未来几个月内将自动浏览功能与 Gemini Spark 集成,以便您的全天候个人 AI 智能体能够代表您在浏览器中执行操作。

自动浏览功能为用户找到停车位。

12. 使用 Nano Banana 随时随地转换图片

借助 Nano Banana,您可以在 Android 设备上浏览 Web 时即时创建或自定义图片。只需在学习时问问 Chrome 中的 Gemini“将此页面转换为信息丰富的信息图”,或在浏览公寓时要求“更改图片以包含现代客厅必需品”。

Nano Banana 根据博文生成信息图。

13. Chrome 中的技能:将最佳 AI 提示转换为一键式工具

借助 Chrome 中的技能,您可以保存和重复使用桌面版 Chrome 中的 Gemini 中最有用的 AI 提示。只需保存一次多标签页工作流(例如在购物时并排生成规格比较,或扫描长文档以查找关键信息),然后随时点击一下即可立即再次运行。

Chrome 中的技能可帮助您最大限度地提高食谱中的蛋白质含量。

14. 从屏幕中选择内容以提示 Chrome 中的 Gemini

现在,您可以使用鼠标指针向 Chrome 中的 Gemini 问问您正在查看的网页的特定部分,而无需准确描述您的意思。例如,您可以选择页面上的两种产品,并立即比较其主要功能。或者,如果您想使用 Nano Banana 编辑图片,您可以准确选择要更改的图片部分

图片
使用指针比较页面上的图片。

15. 在整个 Web 上使用语音

很快,您就可以在桌面版 Chrome 中使用语音在网站上输入内容。借助语音,您可以更轻松、更自然地完成草拟评论、在表单中填写长字段或撰写电子邮件等操作。这将使用 Gemini 模型来清理您的转录内容(删除“嗯”和“啊”等语气词,并使其符合上下文,同时保留您的语音),或者按照您的要求填写字段。

使用语音在 Web 上输入文本,Gemini 模型可以帮助您进行编辑。

后续步骤

向智能体 Web 的过渡正在我们眼前展开。通过弥合强大的底层 AI 功能与日常 Web 开发之间的差距,我们正在消除历史上减缓和限制创新的摩擦。

我们正在从需要您完成所有繁重工作的 Web 转向主动为您工作的 Web。 无论您是希望与基于浏览器的智能体无缝集成,突破网页功能的绝对视觉限制,还是仅仅希望简化自己的调试工作流,我们都将为您提供构建未来 Web 的工具。

请访问 developer.chrome.comweb.dev,查看完整指南和技术深入分析。我们希望了解您使用这些新 功能构建的内容。因此,请分享您的项目,并务必通过 XLinkedInYouTube与我们联系。

我们将在下一届 Google I/O 大会上与您相见!