智源大会落幕,200+AI大佬达成了哪些共识?

6月12日,第八届北京智源大会开幕。

中关村国际创新中心,两天时间,200多位全球顶尖AI专家——图灵奖得主、Meta和英伟达的科学家、清华北大教授、阿里腾讯的AI负责人——全到齐了。过道都站满了人。

他们讨论的核心问题只有一个:AI的下一步往哪走?

两天下来,三个共识反复出现在每一场演讲、每一轮圆桌、每一次私下交流里。


共识一:Agent会比你想象的更早接管你的工作流

如果你还在用"先打开ChatGPT、再复制结果、再粘贴到另一个工具里"的流程,这个流程最多再活半年。

本届大会最密集出现的关键词不是"大模型",而是Agent——能自主规划、调用工具、分步骤完成复杂任务的智能体。

一个简单的例子被反复提及:你给Agent一个任务"帮我做一份本月的竞品分析报告",它自己去搜资料、调数据分析、写PPT大纲、排版、发邮件给你审核——不用你分步操作,全程自动。

这背后是靠什么?不是靠一个模型。

搜索用搜索引擎API,数据分析跑代码执行环境,写文案调大语言模型,排版调文档工具链——一个Agent在执行一个任务的过程中,最少要调用3到5个不同模型或工具。

Meta首席AI科学家杨立昆在大会上说得更直白:"未来的AI系统不是一个大黑箱,而是一个调度系统——知道在什么时间、用什么工具、解决什么问题。"

多模型API切换,就是这个调度系统的底层能力。不是可选功能,是刚需。


共识二:世界模型——AI必须走出对话框

本届大会由智源研究院院长王仲远定调:AI正从"大语言模型"走向"世界模型"。

大语言模型擅长的是"文字描述世界"。你说"杯子掉在地上会碎",它能告诉你为什么。但你让它预测一个真实世界中正在坠落的杯子下一秒会发生什么——它做不到。

这并不是概念的升级,这是能力的维度跨越。

智源把世界模型分成了四条技术路线:以语言为中心、以像素为中心、以三维结构为中心、以视觉表征为中心。每条路线都有代表团队,也各有局限。目前还没有一条路能跑通,但资金已经疯狂涌入——过去18个月,全球超过100亿美元砸进了世界模型和机器人AI方向。

具身智能是确定性最高的落地场景。智源发布了"悟界·RoboBrain Orca"——一个让机器人理解物理世界、自主完成任务的具身大脑。物流、酒店、工厂巡检,真实场景已经在跑了。

但这里有一个关键问题——一台机器人需要同时跑视觉识别、路径规划、任务决策、对话交互四类模型,没有一个是同一个厂家提供的。

视觉模型可能是智源自研的,路径规划跑英伟达,任务决策用DeepSeek,对话用通义千问。四个模型串成一条工作流,只要中间一个接口崩了,机器人就是一堆废铁。

所以,具身智能大规模落地的第一步,不是模型算法突破,是AI模型统一接口这件事先跑通。


共识三:差距不在参数,在调用效率

国内超过60个大模型通过备案,全球可调用的超过200个。

"谁能做出最强模型"的时代交卷了。下一题是:谁能把200个模型调度得最合理。

写代码找DeepSeek,长文档丢Kimi,产品视频Seedance最能打——每个任务选对的模型。这事需要一个中间层:大模型API聚合平台,200+模型API接入统一成一个入口。模型再怎么升级迭代——接口不变、Token逻辑不变。

王仲远闭幕时说:"从卷参数,转向卷调用。"

统一的接口后面,器灵模型在不断替你选最优解。可以去试试看调用效率是不是真的那么高,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值