
【谷歌年度开发者大会规模扩大】
谷歌年度开发者大会规模不断扩大,近年来已拆分为两场活动。这家科技巨头上周举办了一场专注于安卓移动操作系统、Google Books 等内容的活动,而今天的活动则聚焦于其他平台。两场活动的共同主题是该公司的 AI 工具,主要围绕其 Gemini 聊天机器人及相关技术。基本上,和整个 2026 年一样,关键词就是“智能体(agent)”。
点击观看:谷歌是否改变了一切?科技专家对 2026 年 Google I/O 大会的反应(时长 38:50)
【大会新功能与新技术】
这类活动往往充斥着“你可以这样做!”以及“某某新模型”之类的演示,但至少对一些人而言,还是有几项新功能和新技术脱颖而出。其中引人注目的有 Google Docs Live、Ask YouTube 的部分功能、Google Flow 和 Flow Music 的改进,以及智能眼镜的一些特性。
大会有很多内容吸引了其真正的受众——开发者,比如可快速生成用户界面屏幕的工具、更高效的模型更新,以及他们所需的其他功能。但也有人更关注这些技术能给大家带来什么。
欢迎查看对 2026 年 Google I/O 大会的全面报道,以及存档实时博客中对该活动的逐点评论。
【Google Docs Live】
在 2026 年 Google I/O 大会上,谷歌宣布 AI 服务订阅用户今年夏天将在 Google Docs 中获得一款名为 Docs Live 的语音听写和整理工具。
Docs Live 可以转录并整理语音笔记,对一些人来说,它是在测试产品等场景下管理思绪的潜在好方法(目前,得来回切换去做笔记)。毫无疑问,如果它足够好用,很多喜欢语音输入而非打字的人都会从中受益。正如谷歌 CEO 桑达尔·皮查伊所说,这是一种“口头头脑风暴”。
似乎使用该工具无需授予其访问其他谷歌账户或网络历史记录的权限,这是采用谷歌很多 AI 工具的一大障碍,不过理论上,授予访问权限能获得更好的效果。
当然,它并非免费。Google AI 订阅用户,特别是 AI Pro(每月 20 美元)或 Ultra(每月 100 或 200 美元)套餐的用户才能使用。
【谷歌搜索增强响应】
近年来,谷歌持续将 AI 融入搜索引擎,整合其 AI 驱动的搜索工具,提升智能体能力,并纳入更多上下文信息,如上传的照片和 PDF 文件,以及打开的 Chrome 标签页。
谷歌还将 SynthID 技术扩展到 Chrome 浏览器。SynthID 可读取图像中的编码元数据,以报告图像是否使用 AI 生成或修改。不过,该技术需要合作伙伴支持,所以可能无法识别不太流行的模型生成的内容。
点击观看:《安卓秀 I/O 版亮点:Google Books、安卓汽车等》(时长 14:39)
一个新的智能搜索框支持复杂的自然语言查询和对响应的后续查询,以及能采取行动并生成可视化结果(如示例模拟)的多模态智能体。但对一些人来说,更有趣的是可以用一种氛围智能体创建自定义智能小部件。如果理解正确的话,这是一种保存复杂、重复搜索和操作的方式。
【Ask YouTube】
YouTube 长期以来都是一个重要的搜索引擎,尤其在获取操作指南类内容方面。Ask YouTube 能以所需格式为自然语言查询提供视频结果,有人最喜欢的功能是能直接跳转到所需视频的相关部分。
这一功能可能会引发争议,因为它有可能大幅削减创作者的收入来源,创作者的收入通常依赖于观众观看时长和广告浏览量。不过,另一方面,有人在查找操作指南和游戏攻略内容时,往往会跳过视频结果,因为讨厌在视频中反复拖动进度条寻找所需信息。有人觉得大多数人可能和自己不一样,所以这对很多创作者来说可能仍是净损失。目前,该功能仅向 Premium 订阅用户开放。
【Google Flow 和 Flow Music】
谷歌的创作工具,新的 Omni 模型驱动着谷歌最新的创意生成式 AI 功能。它是一种新的多模态模型,可根据文本、音频、其他视频和图像等任何输入生成视频。该模型的更快版本 Omni Flash 驱动着 Flow 和 Flow Music 等产品中的工具,Flow 和 Flow Music 是谷歌用于视频和音乐生成的软件。
现在,Flow 集成了对话式智能体,可以向其提供当前和过往项目的上下文信息,辅助头脑风暴和创建模板,理论上它在模拟物理效果方面表现更好。谷歌还称,Omni Flash 能实现更精确的编辑等功能。Flow Music 则扩展到支持编辑乐曲的部分内容,比如在不影响节奏的情况下替换或编辑歌词。
这些功能都有可能改善工作流程,而不是凭空制造出一堆无用的东西,不过可以肯定的是,也会出现很多后者的情况。Flow 和 Flow Music 的原生移动应用向所有 AI 套餐订阅用户开放。
【智能眼镜】
谷歌将其智能眼镜产品统称为“智能眼镜”,涵盖从 XR 眼镜到仅支持音频的型号。
有人不太喜欢仅支持音频的智能设备,比如在 CES 上发布的耳机,因为使用它们需要记住自己刚说过或做过的事,需要视觉信息。
点击观看:《智能眼镜的未来将于今年秋季到来》(时长 07:00)
但对于能记住 30 秒以上事情的人来说,能理解这些设备的吸引力。对一些人来说,佩戴抬头显示器四处走动可能会带来问题,有人怀疑这会像使用手机一样,在行走时导致很多分心事故。
有人对 Project Aura 更感兴趣,该项目已开发了一段时间,今年晚些时候终于可以购买。原因在于,它看起来像是一款轻便的 VR 竞品——一副 Xreal 眼镜搭配一个运行安卓 XR 系统的处理器模块,可与手机、笔记本电脑或 Steam Deck 等其他设备连接使用。谷歌已与 Warby Parker 和 Gentle Monster 等眼镜供应商达成合作,相关产品将于今年秋季推出。
值得注意的是,部分智能眼镜将支持 iOS 系统,使其与 iPhone(或许还有 iPad)兼容。苹果即将与 Gemini 进行集成,以弥补 Siri 的不足,这也预示着 MacOS 将在夏季支持 Gemini Spark 和 Gemini Voice —— 这意味着可能会在 6 月的全球开发者大会(WWDC)上听到更多关于这两款新产品的消息。
【大会存在的问题】
最终,在这场三小时的活动中,值得关注的内容只有五项,不算太多。相比那些让人觉得“想要”的亮点,更多内容往好里说是存在问题,往坏里说是有些反乌托邦。有时感觉直播里的掌声像是后期添加的,因为实际的鼓掌情况与声音并不相符。
许多智能体功能似乎是在寻找受众的功能,而且和竞争对手一样,谷歌似乎完全没有意识到这些没人要求的“智能”功能会带来负面影响。例如,为 Chrome 浏览器打造的、对零售商友好的智能购物平台就引发了一系列常见问题,比如如果智能体链出现故障,谁来负责退款?购物交易中的摩擦对消费者来说不一定是坏事,但这对卖家来说却是大忌,因为他们通常不希望给顾客思考的时间。
公平地说,Google I/O 大会的受众是开发者和投资者,他们通常更关心这些变化如何带来收益。
777

被折叠的 条评论
为什么被折叠?



