Sora2不够香了!这款国产AI视频模型已经能边看边生成,生成快还互动佳
量子位·2025-10-15 18:20

核心观点 - 百度蒸汽机模型实现了AI视频生成从“短片段、单向输出”到“长篇叙事、实时交互共创”的范式转变,在实时流式生成能力上超越Sora2等当前主流模型 [9][15][44][63] 技术能力与产品特性 - 模型支持“图生视频”和“视频生视频”两种生成模式,仅需一张图片和一个简单指令即可生成长视频,大幅降低操作门槛 [17][18] - 实现“边看边生、实时交互、无限续写”三大功能:生成过程流式呈现,用户可实时查看进展;支持随时中断生成并修改提示词,无需从头开始;可上传任意视频进行续写,打破生成长度限制 [6][7][22][24][39][40][42][43] - 生成有声视频时最长时长为5-10秒,生成无声视频时默认时长为20秒,可选择10-60秒 [21][27][28] - 在开放世界生成中表现优异,用户可通过WASD+鼠标控制视角进行自由探索 [31][32] 技术架构创新 - 采用自回归扩散模型架构,通过流式滑窗实现低成本无限外推和实时生成 [45] - 引入噪声重注入和历史帧扰动增强机制,提升模型应对突发调整的稳定性和准确性 [45][46] - 通过锚点帧引导和历史参考帧技术保障生成画面的全局一致性与连续性 [47] - 基于高压缩比生成技术,结合窗口attention优化和模型蒸馏,将推理延迟压缩至近乎实时 [47][48] 行业影响与市场定位 - 百度蒸汽机在5月份以89.38%的得分首次亮相即登上VBench-I2V图生视频全球榜单第一 [5][61] - 公司于7月发布支持音画一体生成的模型,于8月实现多人有声视频生成,于9月推出通用AI长视频生成功能,于10月将AI视频带入实时交互时代 [53][61] - 该技术推动AI视频能力向导购、直播、教育、影视制作等商业和应用场景延伸,使其从创意工具转变为创意伙伴和新型创作平台 [58][59]

Sora2不够香了!这款国产AI视频模型已经能边看边生成,生成快还互动佳 - Reportify