
FORCE 原动力大会:火山引擎推豆包 2.1 等多模型,多行业落地目标清晰
智东西 6 月 23 日报道,今日,在 FORCE 原动力大会上,火山引擎推出豆包大模型 2.1,同时预告了视频生成模型 Seedance 2.5、图像创作模型 Seedream 5.0 Pro 以及豆包音频生成模型 1.0 的发布。
首先,豆包大模型 2.1 在通用 Agent、编程能力以及多模态水平上有所提升,它包括豆包大模型 2.1 Pro 和豆包大模型 2.1 Turbo。其中,豆包大模型 2.1 Pro 在编程能力上接近 Opus 4.7。价格方面,豆包大模型 2.1 Pro 统一定价为输入 6 元、输出 30 元,缓存命中 1.2 元,综合使用成本相比 Claude Opus 4.6 到 4.8 系列模型降低接近 80%。同时,面向高频调用场景的豆包 2.1 Turbo 同步上线,价格仅为 2.1 Pro 的一半。此外,火山引擎还推出了 Doubao - Seed - Evolving,面向 Coding 与 Agent 的重度用户,将会以每月 2 至 4 次的频率快速进行迭代,让开发者可以明显感受到模型的变化。
大会还预告了即将发布的 Seedance 2.5、Seedream 5.0 Pro 以及豆包音频生成模型 1.0。其中,Seedance 2.5 将单条视频生成拉长至 30 秒,Seedream 5.0 Pro 新增了圈选编辑和多图层分离能力,豆包音频生成模型 1.0 则实现了角色音色自动推理和影视级音效一次性生成。Seedance 2.0 也做了升级,支持原生 4k 视频直出。
大会上,火山引擎总裁谭待公布了一组数据:截至今年 6 月,豆包大模型日均 Tokens 调用量达 180 万亿,相比两年前发布时增长超过 1500 倍,过去一年增速超过 10 倍。在公有云市场,火山引擎份额升至 49.5%,同时,年消费超 1 万亿 Tokens 的企业客户从去年 12 月的 100 家翻倍到了 200 家。
除了模型发布,火山引擎还展示了在智能体开发、产业落地、AI 安全、商用拓展等方面的综合进展。下面我们来详细看看各方面的情况:
01. Coding 能力追平 Opus 4.7,成本低 80%
豆包大模型 2.1 Pro 是本场发布会的第一颗重磅炸弹。编程评测中,豆包大模型 2.1 Pro 与 Claude Opus 4.7 基本持平,在 SciCode 科学计算评测中拿到 59.8 分,超过 Opus 4.7 和 GPT - 5.5,在 NL2Repo 仓库级代码生成评测中,豆包大模型 2.1 Pro 得分 47,明显领先 GPT - 5.5 和 Gemini 3.1。现场演示了一个芯片设计场景的硬核案例:豆包大模型 2.1 Pro 围绕一个 16×16 PE 的 Tile TPU,连续运行 18 小时、经历 9 轮迭代,完成了 6 个核心模块、1300 多行 RTL 代码,并跑通了仿真测试和检测流程,最终通过了手写数字识别验证。这类任务通常需要 3 到 5 名资深工程师数周的努力。
Agent 能力方面,豆包大模型 2.1 Pro 在 MCP Atlas 评测(覆盖 36 个真实 MCP Server、220 个工具、1000 多个任务)得分超过 Opus 4.7 和 GPT - 5.5。在检验 Agent 与多模态能力的 OS World 和 Mobile World 等评测中,豆包大模型 2.1 Pro 也位居全球前列。在 Agent 能力演示环节,火山引擎展示了一段多 Agent 协同构建 3D 虚拟城市的案例。开发者结合豆包大模型 2.1 Pro 的多模态能力,让 500 多个 Agent 协同作业,在跨工具的完整链路中依次调用建模、渲染、贴图等 11 种工具,累计触发工具调用上千次,最终在一张大地图上完成了 100 多栋造型、材质、颜色均不相同的建筑的搭建,并通过多轮自我迭代生成全景成片。
目前,豆包大模型 2.1 已在火山引擎开放 API 服务,火山方舟体验中心同步上线,豆包、TRAE、扣子等产品同步接入。
02. 视频、音频、图像模型齐发,Seedance 2.5 预计 7 月上线
视频生成是火山引擎声量最大的赛道,今年 2 月发布的 Seedance 2.0 被该团队称为 "全球第一个跨过生产质变点的视频生成模型",这次预告的 Seedance 2.5 在多个维度上做了升级:单条视频最长 30 秒,目前市场同类产品最多 15 到 20 秒,全球第一。多参考输入支持最多 50 个全模态素材联合输入,同样是全球最高。Seedance 2.5 的 3D 白模预演能力是本次视频模型升级中的一个关键功能,据字节跳动 CEO 梁汝波透露,这个功能灵感出自于一位业内知名导演,他在与火山引擎的合作中提出:科幻片和大场景调度中,3D 白模是前期预演的核心工具,能帮团队提前确定空间、机位、走位和镜头运动,但传统制作耗时耗力。Seedance 据此开发了白模预演生成能力,成为行业内率先提供这一功能的视频生成模型。这意味着创作者在前期投入的资产设计和镜头调度,可以被模型直接承接,不用推倒重来。画质方面,Seedance 2.5 生成的 AI 素材可以直接进入专业影视后期,新增的编辑能力支持局部修改,如微调背景、更换商品和模特等。
图像方面,Seedream 5.0 Pro 主推三个能力:
1. 交互式精准编辑。用户可以画箭头、圈选区、用自然语言描述空间关系,模型理解意图定位到指定元素修改。
2. 多图层分离。可递归拆分图层,拆分后底板自动智能填充。
3. 高信息密度排版。单张图可承载整页 PPT 级别信息,支持英文、西班牙语、阿拉伯语、日语等 10 余种文字,自动适配各语言排版习惯和文化风格。
音频方面,豆包音频生成模型 1.0 首次亮相。模型可以根据文本自动推理角色声音特征,一次生成包含情绪表达、方言口音、背景音乐、环境氛围音、拟音特效的完整影视级音轨。发布会演示了一段古风武侠片,从人物对白到环境雨声、兵器撞击声全部由模型生成,时长近一分钟,音色不漂移、角色声音特征一致。
03. 周星驰正版授权,AI 走进全行业
火山引擎在大会上正式预览了 AI 版权商业化平台,周星驰成为首批合作对象。他以《喜剧之王》《食神》《长江七号》三部经典 IP 授权入驻,用户可在抖音、即梦、剪映等平台用官方模板进行二创。
除视频创意之外,豆包大模型在各行业的渗透速度同样迅速。特斯拉基于豆包大模型打造智能语音车控,覆盖全系车型,接入了端到端实时语音模型。奔驰新款纯电 CLA 接入豆包大模型,支持自然对话和情绪感知。东风汽车今年 4 月与火山引擎达成战略合作,围绕智能座舱、企业数智化升级等领域展开深度合作。
金融和芯片行业中,中金财富基于 HiAgent 搭建数字投顾 Agent,萃取 300 余名分析师研究成果和数千名投顾经验,定制金融智能体矩阵。安谋科技与火山引擎围绕 EDA 混合云展开合作,通过云端弹性算力补充本地资源,利用火山引擎 Agent 产品推动研发流程自动化。
运输、教育等行业中,顺丰依托 AgentKit 构建覆盖研发到调度的全场景 AI 办公助理。新东方用豆包打造 AI 助教,覆盖口语练习、作文批改、个性化学习。
支柱产业中,中国石油勘探院用上了安全运营 Agent,异常告警实现 AI 自动化值守,运营效率提升 10 倍。中国移动与火山引擎联合推出移动引擎机密模型服务,面向政务、金融、能源行业提供国产算力一体化的机密模型服务。
04. HiAgent 3.0 全新升级,一键招募数字员工
企业级产品线上,HiAgent 3.0 是本次最重要的发布。IDC 报告显示,HiAgent 在中国智能体开发平台产品力进入领导者象限且位列第一,市场份额 17.8%,同样行业第一,超过第二名和第三名总和。
数字员工管理方面引入了一套完整机制:企业可以在员工市场一键雇佣活动策划等数字员工,把已有的各类智能体快速接入统一管理。数字员工上岗前必须通过考核,系统提供通用考核模板,评估回答准确率、幻觉率、延迟、安全合规等指标,企业也可上传自己的评测集。
通过考核后,调度中枢会基于业务目标自动拆解任务、分发给不同数字员工协同执行。管理者则可以通过数字员工大盘统一查看状态。同时,分布式 Harness 记录不同 Agent 的运行轨迹、业务反馈和成功做法,总结到全局经验中,越用越聪明。
企业级 AI Agent 平台 AgentKit 新增 policy 和 register 两个模块:policy 控制 Agent 行为边界,确保在身份、权限和策略范围内执行;register 负责 Agent 的资产注册和发现治理。
05. 结语:字节把 AI 全家桶摆上桌面,全行业落地目标清晰可见
豆包大模型 2.1 Pro 编程能力对标 Opus 4.7,价格打 2 折,Seedance 2.5 视频生成 30 秒直出全球第一,音频模型、图像模型齐齐亮相,字节跳动在 FORCE 原动力大会上展示了其全模态发展的路径,从质量到价格全方位升级。此外,在企业管理、产业落地、商业化拓展等方面,都充斥着字节系 AI 产品的身影,其全模态发展,全行业落地的目标已然清晰可见。
41

被折叠的 条评论
为什么被折叠?



