
北京,火山引擎FORCE大会。字节跳动的Seedance视频生成模型更新到了2.5版本,内测收尾,预计7月初上线。
这次更新有三个首次:单段视频直出30秒、最多50个参考素材同时输入、能直接拿3D白模生成渲染视频。
和2.0比,变了什么
Seedance 2.0发布于3月,当时的亮点是5秒视频和动态笔触风格。从2.0到2.5,中间隔了一个2.1,但跳过了2.2到2.4,直接跳到2.5——版本跨度的背后,是功能跨度的拉大。
2.0能做的事:文生视频、图生视频、风格迁移、5秒时长。2.5在此基础上加了局部编辑、多模态参考、30秒时长,以及最重要的3D资产支持。如果说2.0是在画布上添笔触,2.5是把画布换成了全套工具台。
三个核心功能

**单段30秒原生输出。**不拼接,一镜到底。对叙事类内容来说,这是从"小样"到"成片"的距离——以前一段30秒的广告片要拼接五六段,风格抖动靠后期硬修,现在一次生成。
**50个参考素材联合输入。**图片、视频、文字、3D模型,不限模态。一个实用场景:设计团队给几张效果图,文案团队给一段脚本,拍摄团队给一段实拍,全部丢进去,模型输出风格统一的视频。各交各的素材,谁来统稿由模型决定。
局部可控编辑。视频生成后如果某个细节不满意,不用全部重来,框选区域直接修改。这在海报级视频制作中是刚需——不可能因为一朵花的位置不对就整条重做。
谁最需要它
AI短视频创作者是第一波受益者。30秒时长意味着一条产品种草视频可以一次生成,不用拼接。局部编辑意味着反复调片的时间大幅压缩。
游戏和影视行业的预可视化团队是第二波。3D白模直出渲染视频,对早期概念验证阶段帮助很大——项目没拍板前,不用花大价钱请渲染团队,先用Seedance跑一轮。
广告制作和工业设计团队也能用上。50个参考素材联合输入,最适合需要统一多部门素材的场景——产品图、场景图、文案、分镜脚本,全部在一个模型里融成成品。
升级为什么这么快
从2.0到2.5只用了三个月。这个速度不是偶然的。
火山引擎的算力储备和豆包的模型基础是底层支撑。Seedance基于豆包大模型体系,底层的语言理解和视觉理解能力随豆包2.1 Pro升级而同步提升。字节自研的万卡集群、高吞吐训练框架,大幅压缩了模型迭代周期。
数据积累也是关键。Seedance上线几个月,积累了海量用户生成视频和反馈数据——什么风格受欢迎、哪些场景容易翻车、用户最常修改什么。这些数据反哺训练,让每次迭代都更精准。
还有一个因素:方向确定了。2.0上线后用户反馈最集中的需求就是"时长不够、编辑不便、3D不行"。2.5直接对准这三个方向打,没有走弯路。
用起来是什么效果
30秒的连续画面,运动轨迹是连贯的。以前AI视频经常出现"前一秒还在讲PPT,后一秒突然跳到太空"的割裂感,2.5的30秒直出把这个痛点解决了。
50个参考素材一起喂的效果是:风格一致性大幅提升。只传一两张图时,模型容易"跑偏"——生成的视频跟参考图气质不搭。参考素材够多够全,模型的风格锚点越明确。
3D白模转视频是体验变化最大的地方。输入一个游戏场景的白模,Seedance 2.5能输出一段有光照、有材质、有运动轨迹的渲染视频。虽然还不到3A级渲染的精细度,但用在预可视化、早期demo、提案展示上,质量完全够用。
对经常做视频的团队来说,Seedance 2.5把"从创意到出片"的时间压缩了一截。以前花一周做预演,现在花一天。以前花三天调片,现在花半天。
一点题外话
视频生成模型越来越多,每家各有强项。对创作者来说,好的一面是选择变多,难的一面是管理成本也在涨,每多用一个模型就多一套流程。但如果使用器灵模型广场,把这些模型统一接管起来,按需切换,计费透明,那工具链的效率和产出的数量就不是线性关系,而是乘法关系了。
Seedance 2.5的上线说明一件事:AI视频的能力爬坡还在加速。谁能在工具链上先一步跑通流程,谁就能把更多的精力花在创作上,而不是花在工具切换上。
2306

被折叠的 条评论
为什么被折叠?



