不儿,这谁还能看出是AI演的视频啊
量子位·2025-12-18 17:26

产品发布与核心功能 - 火山引擎在FORCE原动力大会上推出了最新的豆包视频生成模型Seedance 1.5 Pro [5] - 该模型主打音画高精同步和一镜入戏,能够通过单一Prompt同时生成人物对白配音、背景音乐和音效 [4][6] - 模型已上线即梦AI、豆包APP和火山方舟体验中心,企业用户自12月23日起可在火山引擎使用该模型API [11][12] 技术亮点与性能 - 采用原生音视频联合生成架构,基于MMDiT建立双分支DiT架构,实现视觉流与听觉流在潜在空间的实时通信,从底层解决音画同步问题 [40][41][42] - 通过高质量音视频数据框架,筛选了数以亿计的高清视频并进行自动化标注,为模型注入丰富的视觉描述和匹配的音频语义信息 [43] - 引入针对音视频场景定制的RLHF算法进行后训练优化,从视觉美感、运动连贯性、音频保真度及音画匹配度进行全方位调优 [44] - 通过多阶段蒸馏技术和高效推理加速框架,将推理速度提升了10倍以上,实现快速生成 [47] - 在审美、运动质量以及音画对齐等核心评测指标上处于行业领先地位,在多语言对白和方言口型匹配任务中表现显著优于主流模型 [52][53] 实测效果与应用场景 - 模型能够精准理解Prompt,实现音画精准同步,生成具有电影级气场和叙事张力的视频片段 [18] - 能够复刻复杂的专业运镜,例如成功复刻了周润发在MAMA颁奖典礼中的百万级运镜效果 [22][25] - 原生支持多人对话及多种方言,如四川话、粤语、上海话、台湾腔等,并能精准捕捉方言独特的韵律和情感张力 [11][27][28] - 总体体验方便快捷,对于非复杂场景基本可以“一条过”,具备低成本制作短剧、广告片及辅助影视创作的实战能力 [30][59] 未来功能与效率提升 - 即将推出Draft样片功能,允许用户先生成低分辨率草稿视频以快速试效果和调方向,并能锁定关键元素确保与最终成片内容一致 [32][33] - 据官方数据,Draft样片功能预计能将整体创作效率提升约65%,同时减少60%无效创作成本 [35]