可靈3.0系列模型全面上線開啟「人人皆可當導演」的新時代

文章核心观点 - 快手科技旗下可靈AI正式全球上线3.0系列模型，标志着其AI生成能力从基础工具向理解艺术意图的智慧创意伙伴的根本性转变，旨在开启“人人皆可拍电影”的新时代 [1][6] 产品发布与核心升级 - 可靈AI于2026年2月5日正式全球上线3.0系列模型，包括可靈視頻3.0、可靈視頻3.0 Omni及可靈圖片3.0、可靈圖片3.0 Omni模型 [1] - 该系列模型基于All-in-One产品理念构建，支持全模态输入与输出，将视频的理解、生成和编辑整合到一个高效流畅的AI工作流中 [1] - 模型将文字转视频、图像转视频、参考转视频以及视频内编辑等多任务统一融入单一的原生多模态架构 [1] 视频模型3.0系列关键功能 - 叙事控制与一致性：通过改进元素一致性提升创作控制，允许上传参考视频和多张图像参考，确保人物、物体和场景在各帧间保持视觉连贯 [2] - 全球首创技术：可靈視頻3.0全球首创“图生视频+主体参考”技术 [4] - 多语言与方言原生音频：支持生成中文、英文、日文、韩文、西班牙文以及多种英语口音和中国方言，并能制作复杂的多角色对话场景，精准控制内容、语调和发言顺序 [4] - 延长视频时长：支持最长15秒的视频生成，使模型能够处理复杂序列，包括长镜头和多重剧情转折，实现平滑、电影般的过渡 [4] - 智能多镜头叙事：理解多场景、多镜头指令，动态调整机位角度和镜头以匹配创作方向 [4] - 图像文本保留：能够高精度保留或生成文本（如标志、字幕、品牌元素），对电商广告等场景尤为宝贵 [4] - 照片级真实输出：可生成具有生动表情和动态表演的逼真人物，提升整体真实感 [4] 视频模型3.0 Omni特定功能 - 全能参考与极致一致性：基于可靈視頻O1的元素构建功能，提供先进的基于参考的生成，实现无与伦比的一致性，可提取参考视频中人物的视觉和声音特征并在新场景中忠复现 [3] - 多镜头故事板：推出多镜头故事板功能，允许用户在故事板中为每个镜头指定时长、镜头大小、视角、叙事内容以及镜头运动，生成专业级镜头 [5] 图片模型3.0系列关键功能 - 超高清视觉：可靈圖片3.0及可靈圖片3.0 Omni模型均支持2K和4K超高清输出，适用于从虚拟场景可视化到完整专业场景生成 [6] - 电影级真实感：模型展现出非凡的真实感，以惊人精度和一致性保留纹理、光影以及材质品质 [6] 技术演进与市场定位 - 可靈3.0系列模型建立在全新推出的可靈O1和2.6系列基础上，体现了多模态视觉语言框架，是从基础视频生成向复杂专业编排的决定性进化 [6] - 该系列模型在叙事精度、输出质量和电影级控制方面带来实质性进步 [6] 用户获取与商业进展 - 自2024年6月推出以来，可靈AI已服务全球超过6000万创作者，累计生成超过6亿条视频，并与超过3万家企业客户建立合作关系 [6] - 其应用覆盖电影和广告行业，加速故事板与产品概念的可视化，并优化从动画、电脑生成影像到全新视觉创作的生产流程 [6] 发布与访问安排 - 可靈3.0系列模型现已向Ultra订阅用户提供独家早期访问权限，并即将向公众开放 [6]