Workflow
可灵3.0 Omni
icon
搜索文档
实测可灵3.0 - 属于每个人的导演时代。
数字生命卡兹克· 2026-02-05 10:23
核心观点 - 可灵视频生成模型从2世代升级至3世代,实现了跨越式进步,将AI视频模型能力提升至新的天花板水平 [1][3] - 可灵3.0是一个无短板的“超强水桶”,其核心能力升级主要体现在分镜能力和语言能力两个特殊方向上 [7] - 结合可灵3.0与可灵3.0 Omni模型,可以覆盖约百分之九十的视频生成场景,预示着AI视频生产力将迎来巨大提升,未来可能进入“属于每个人的导演时代” [51][52] 分镜能力 - 可灵3.0允许用户生成3到15秒内任意时长的视频,并可规定视频包含的分镜数量及每个分镜的时长 [8] - 提供“智能分镜”功能,用户仅需提供简单提示词并开启开关,模型即可自动生成一系列分镜,极大简化了创作流程 [8][9] - 提供“自定义分镜”功能,用户可详细设定每个镜头的景别、内容、时长及音效,实现对画面的精细化控制 [16][17] - 模型具备强大的“正反打”镜头生成能力,能够丝滑实现对话场景及网球比赛等场景的镜头切换,解决了此前视频模型的难点 [19][20][23] - 分镜能力可用于制作产品广告短片等视频demo,使展示效果比单纯的分镜图更为直观 [24][26] - 支持“故事板生视频”的新玩法,用户可先用AI生成故事板图像,再结合提示词让可灵3.0生成完整视频,效果良好 [26][28][29] 语言能力 - 可灵3.0具备强大的多语言处理能力,能精准处理包含五六个人物、多种语言的复杂对话场景,指令遵循能力精准 [5][7][31] - 语言能力支持根据不同的语境和故事切换语气、口音,使表达与意图完美融合 [31][39] - 基于其语言能力,衍生出“邪修背单词”等创新玩法,可生成将单词谐音与含义巧妙融入剧情的学习视频 [31][33][36][37] - 语言能力可与分镜能力结合使用,例如生成一系列角色与不同客人说不同语言的快速切换镜头 [39][41] 可灵3.0 Omni模型 - 可灵Omni模型从O1升级至3.0 Omni,其核心能力是对现有视频进行编辑和修改 [42][44] - 与主打生成的3.0模型不同,3.0 Omni在视频修改方面表现突出,例如能完美替换视频中的主角并还原人物动作 [44][45] - 3.0 Omni的参考视频时长需控制在3-10秒内,适用于视频改视频的场景 [49] - 3.0与3.0 Omni均支持“视频提取主体”功能,可从本地或历史视频中提取主体,并添加主体音色参考 [45][49] - 两个模型能力互补:有视频编辑或视频参考需求可优先使用3.0 Omni;倾向于文生视频、文加图生视频或首尾帧生成则可用3.0 [51] 行业影响与未来展望 - 此次更新是一次全盘升级,目前优先向“黑金会员”开放,类似GPT新模型优先面向Pro会员的策略,预计不久将全量开放 [52] - 未来AI视频创作将变得更简单、平权,并越来越向真正的影视制作靠拢,例如解决普通人难以处理的分镜问题 [52] - 用户生成视频后,可提取其中的主体和声音用于后续创作,并可用Omni模型直接修改视频局部,结合分镜功能可完成视频剪辑与配乐,这将带来AI视频生产力的巨大提升 [52] - AI视频创作领域在沉寂一段时间后,可能即将迎来下一个盛世 [52][53]