智源大会落幕，200+AI大佬达成了哪些共识？

原创于 2026-06-18 13:14:48 发布 · 192 阅读

·

9

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#人工智能

6月12日，第八届北京智源大会开幕。

中关村国际创新中心，两天时间，200多位全球顶尖AI专家——图灵奖得主、Meta和英伟达的科学家、清华北大教授、阿里腾讯的AI负责人——全到齐了。过道都站满了人。

他们讨论的核心问题只有一个：AI的下一步往哪走？

两天下来，三个共识反复出现在每一场演讲、每一轮圆桌、每一次私下交流里。

共识一：Agent会比你想象的更早接管你的工作流

如果你还在用"先打开ChatGPT、再复制结果、再粘贴到另一个工具里"的流程，这个流程最多再活半年。

本届大会最密集出现的关键词不是"大模型"，而是Agent——能自主规划、调用工具、分步骤完成复杂任务的智能体。

一个简单的例子被反复提及：你给Agent一个任务"帮我做一份本月的竞品分析报告"，它自己去搜资料、调数据分析、写PPT大纲、排版、发邮件给你审核——不用你分步操作，全程自动。

这背后是靠什么？不是靠一个模型。

搜索用搜索引擎API，数据分析跑代码执行环境，写文案调大语言模型，排版调文档工具链——一个Agent在执行一个任务的过程中，最少要调用3到5个不同模型或工具。

Meta首席AI科学家杨立昆在大会上说得更直白："未来的AI系统不是一个大黑箱，而是一个调度系统——知道在什么时间、用什么工具、解决什么问题。"

多模型API切换，就是这个调度系统的底层能力。不是可选功能，是刚需。

共识二：世界模型——AI必须走出对话框

本届大会由智源研究院院长王仲远定调：AI正从"大语言模型"走向"世界模型"。

大语言模型擅长的是"文字描述世界"。你说"杯子掉在地上会碎"，它能告诉你为什么。但你让它预测一个真实世界中正在坠落的杯子下一秒会发生什么——它做不到。

这并不是概念的升级，这是能力的维度跨越。

智源把世界模型分成了四条技术路线：以语言为中心、以像素为中心、以三维结构为中心、以视觉表征为中心。每条路线都有代表团队，也各有局限。目前还没有一条路能跑通，但资金已经疯狂涌入——过去18个月，全球超过100亿美元砸进了世界模型和机器人AI方向。

具身智能是确定性最高的落地场景。智源发布了"悟界·RoboBrain Orca"——一个让机器人理解物理世界、自主完成任务的具身大脑。物流、酒店、工厂巡检，真实场景已经在跑了。

但这里有一个关键问题——一台机器人需要同时跑视觉识别、路径规划、任务决策、对话交互四类模型，没有一个是同一个厂家提供的。

视觉模型可能是智源自研的，路径规划跑英伟达，任务决策用DeepSeek，对话用通义千问。四个模型串成一条工作流，只要中间一个接口崩了，机器人就是一堆废铁。

所以，具身智能大规模落地的第一步，不是模型算法突破，是AI模型统一接口这件事先跑通。

共识三：差距不在参数，在调用效率

国内超过60个大模型通过备案，全球可调用的超过200个。

"谁能做出最强模型"的时代交卷了。下一题是：谁能把200个模型调度得最合理。

写代码找DeepSeek，长文档丢Kimi，产品视频Seedance最能打——每个任务选对的模型。这事需要一个中间层：大模型API聚合平台，200+模型API接入统一成一个入口。模型再怎么升级迭代——接口不变、Token逻辑不变。

王仲远闭幕时说："从卷参数，转向卷调用。"

统一的接口后面，器灵模型在不断替你选最优解。可以去试试看调用效率是不是真的那么高，

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。