可灵AI推出数字人功能 最长支持1分钟视频生成

产品功能发布 - 公司推出可灵AI数字人功能 最长支持生成1分钟视频 目前产品公测陆续开放中 [2] - 数字人通过音画高度对齐的交叉注意力机制和强化口型训练策略实现语音与唇形同步 [2] - 采用关键帧控制架构 先构建高层次叙事骨架 再并行生成多片段视频 保持身份一致性 [2] 技术性能表现 - 中文歌曲对口型功能表现优于英文和韩文歌曲 [4] - 英文和韩文歌曲中个别单词与数字人口型仍无法较好拟合 [4]
产品功能发布 - 公司推出可灵AI数字人功能 最长支持生成1分钟视频 目前产品公测陆续开放中 [2] - 数字人通过音画高度对齐的交叉注意力机制和强化口型训练策略实现语音与唇形同步 [2] - 采用关键帧控制架构 先构建高层次叙事骨架 再并行生成多片段视频 保持身份一致性 [2] 技术性能表现 - 中文歌曲对口型功能表现优于英文和韩文歌曲 [4] - 英文和韩文歌曲中个别单词与数字人口型仍无法较好拟合 [4]