核心产品升级 - 可灵AI推出基于2 1模型的全新首尾帧功能 通过升级端到端多模态语义推理能力提升视频生成效果[1] - 与1 6版本相比效果提升235% 在视频转场 视觉呈现 运镜处理及营销素材制作等方面表现突出[1] 技术能力突破 - 改善AI视频生成中常见的转场问题 实现多场景自然衔接 解决场景衔接生硬和"刹车感"[2] - 引入自适应扩散引导与方向重定向机制 在扩散生成每一步动态引导和纠正条件分布 修正偏离语义或视觉逻辑的动态路径[12] - 深度整合用户提示词与首尾帧图片中的视觉语义及动作意图 融合多模态数据 捕捉画面元素在时空维度上的演变逻辑[12] 视觉表现提升 - 实现艺术风格切换与角色动态衔接的无缝连接 案例显示角色发型 服装和光线实现无缝衔接[4] - 增强复杂视觉元素控制能力 实测中人物轮廓变为火焰形态 火山岩浆流动和星空下烈焰升腾等细节清晰[6] - 保持人物/物体身份一致性 色彩风格与画面基调连贯 提升视频专业质感[12] 运镜技术优化 - 支持专业级复杂运镜 通过首尾帧连续衔接实现镜头轨迹与场景逻辑匹配[6] - 案例显示镜头快速向左下摇镜突出爬行机器人 随后快速左摇拍摄逃窜机器人与爆炸场景 提升观看沉浸感[6] 营销应用价值 - 快速生成符合品牌调性的创意展示视频 适用于市场营销领域 降低素材制作成本[8] - 饮品广告案例显示易拉罐从树莓中飞出 树莓如爆炸般散开 果汁飞溅过程自然[10] 竞品性能表现 - 与Seedance1 0 mini对比的整体GSB得分达2 09 与Midjourney对比达2 30 与可灵1 6对比达3 35[10] - 在与Midjourney的两两偏好对比中胜率为62% 与Seedance1 0 mini对比胜率为57%[10] 平台发展规模 - 已完成30次迭代 服务用户超4500万 累计生成视频超2亿条 图片超4亿张[12] - 覆盖广告 影视 游戏等多个行业 巩固在AI视频生成领域的地位[12]
可灵2.1首尾帧功能上线 破解AI视频转场难题
环球网·2025-08-22 16:41