核心观点 - 可灵AI正式全球上线3.0系列模型,标志着AI正式进入影视与创意内容的核心生产环节,公司迈入3.0时代 [1] 产品发布与定位 - 可灵AI正式全球上线3.0系列模型,包括可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型 [1] - 模型覆盖图片生成、视频生成、编辑及后期等影视级全流程链路 [1] - 模型目前正面向黑金会员开放使用,预计将于近期全量上线 [1] 技术理念与架构 - 3.0系列模型基于All-in-One产品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系 [1] - 通过统一架构,将影像创作中的理解、生成与编辑整合为一个连续流程,在单一模型内完成闭环 [1] - 创作者可以同时使用文字、图片、声音与视频作为输入,并直接获得专业影像级输出结果 [1] - 在近期推出的O1和2.6模型基础上,进一步深化Multi-modal Visual Language交互理念,实现了从“基础生成”到“专业调度”的系统性跨越 [12] 关键性能与突破 - 通过整合视频主体上传、音色绑定及全球首创的“图生视频+主体参考”等技术,在人物形象、动作与声音的稳定性上取得突破性进展 [2] - 模型支持最长15秒的连续生成 [2][8] - 视频3.0与视频3.0 Omni均支持原生音画同出,覆盖多语种与多种地方口音 [4] - 图片模块支持4K超清输出,并新增系列组图生成功能 [4][11] - 模型适配多国语言及多种地方口音及方言,实现情绪饱满的音画同步表演 [8] - Omni版本通过特征解耦技术,使角色、道具等元素可在不同场景中自由复用,保持高度一致性 [9] 核心功能与应用 - 全新的智能分镜系统能深度解读剧本意图,自动调度机位与景别,大幅降低后期修正成本 [6] - “图生视频 + 主体参考”技术可对画面特定元素进行二次锚定,有效解决行业长期存在的“主体崩坏”痛点 [8] - 模型能够对镜头节奏、角色关系与视听结构进行系统级调度与协同,使创作者可以在一个模型内完成分镜组织、主体锚定与叙事推进 [12] - 在影视和广告领域,创作者可利用智能分镜等镜头调度能力快速验证创意 [12] - 在游戏与虚拟制作中,稳定的角色一致性则能大幅加速数字资产的构建 [12] 行业影响与公司里程碑 - 此次发布标志着AI正式进入影视与创意内容的核心生产环节 [1] - 可灵AI 3.0完成了从“可用”到“可控”,再到“专业调度”的三次关键跃迁 [11] - 公司从单点生成工具,向内容创意者下一代“创作接口”进化 [12] - 据公开数据,截至2025年12月,可灵AI已拥有超过6000万创作者,生成超过6亿个视频,服务超过3万家企业用户,年化收入运行率达到2.4亿美元 [12]
可灵3.0系列模型正式上线 真实感和叙事能力全面升级
环球网·2026-02-05 10:28