可灵3.0系列模型正式上线真实感和叙事能力全面升级

核心观点 - 可灵AI正式全球上线3.0系列模型，标志着AI正式进入影视与创意内容的核心生产环节，公司迈入3.0时代 [1] 产品发布与定位 - 可灵AI正式全球上线3.0系列模型，包括可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型 [1] - 模型覆盖图片生成、视频生成、编辑及后期等影视级全流程链路 [1] - 模型目前正面向黑金会员开放使用，预计将于近期全量上线 [1] 技术理念与架构 - 3.0系列模型基于All-in-One产品和技术理念构建，形成一个多模态输入与输出高度统一的一体化视频模型体系 [1] - 通过统一架构，将影像创作中的理解、生成与编辑整合为一个连续流程，在单一模型内完成闭环 [1] - 创作者可以同时使用文字、图片、声音与视频作为输入，并直接获得专业影像级输出结果 [1] - 在近期推出的O1和2.6模型基础上，进一步深化Multi-modal Visual Language交互理念，实现了从“基础生成”到“专业调度”的系统性跨越 [12] 关键性能与突破 - 通过整合视频主体上传、音色绑定及全球首创的“图生视频+主体参考”等技术，在人物形象、动作与声音的稳定性上取得突破性进展 [2] - 模型支持最长15秒的连续生成 [2][8] - 视频3.0与视频3.0 Omni均支持原生音画同出，覆盖多语种与多种地方口音 [4] - 图片模块支持4K超清输出，并新增系列组图生成功能 [4][11] - 模型适配多国语言及多种地方口音及方言，实现情绪饱满的音画同步表演 [8] - Omni版本通过特征解耦技术，使角色、道具等元素可在不同场景中自由复用，保持高度一致性 [9] 核心功能与应用 - 全新的智能分镜系统能深度解读剧本意图，自动调度机位与景别，大幅降低后期修正成本 [6] - “图生视频 + 主体参考”技术可对画面特定元素进行二次锚定，有效解决行业长期存在的“主体崩坏”痛点 [8] - 模型能够对镜头节奏、角色关系与视听结构进行系统级调度与协同，使创作者可以在一个模型内完成分镜组织、主体锚定与叙事推进 [12] - 在影视和广告领域，创作者可利用智能分镜等镜头调度能力快速验证创意 [12] - 在游戏与虚拟制作中，稳定的角色一致性则能大幅加速数字资产的构建 [12] 行业影响与公司里程碑 - 此次发布标志着AI正式进入影视与创意内容的核心生产环节 [1] - 可灵AI 3.0完成了从“可用”到“可控”，再到“专业调度”的三次关键跃迁 [11] - 公司从单点生成工具，向内容创意者下一代“创作接口”进化 [12] - 据公开数据，截至2025年12月，可灵AI已拥有超过6000万创作者，生成超过6亿个视频，服务超过3万家企业用户，年化收入运行率达到2.4亿美元 [12]