多模态视觉语言
搜索文档
可灵O1上线,支持组合多个主体参考生成
新京报· 2025-12-02 15:48
产品发布与核心功能 - 快手“可灵O1”AI视频生成模型于12月2日正式上线 [1] - 该模型基于多模态视觉语言理念,将文生视频、视频内容增删、风格重绘、镜头延展等多种任务融合于同一个全能引擎 [1] - 模型支持用户完成从视频生成到修改的全部创作流程 [1] 技术优势与性能参数 - 模型底层强化了对输入图像及视频的理解,具备多主体融合能力,可解决AI视频角色与场景一致性的痛点 [3] - 用户可组合多个不同主体,或将主体与参考图混搭进行视频生成 [3] - 在生成时间方面,模型支持3至10秒视频的自由生成 [3]