可灵2.6模型推出“音画同出”能力中文语音生成效果全球领先

公司产品发布 - 可灵公司于12月3日推出了视频生成2.6模型 [1] - 该模型提供了里程碑式的“音画同出”能力，能够在单次生成中输出包含自然语言、动作音效以及环境氛围音的完整视频 [1] - 模型升级了文生音画、图生音画两大功能，语音支持生成中文与英文，生成的视频长度最长可达10秒 [1] 技术能力与影响 - 新模型彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程，重构了AI视频创作工作流，极大提升创作效率 [1] - 通过对物理世界声音与动态画面的深度语义对齐，可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼 [1] - 该模型在中文语音生成效果上保持全球领先 [1]