音频驱动全身视频生成模型夸克与浙江大学联合开源OmniAvatar

技术创新 - 阿里旗下夸克技术团队与浙江大学联合开源OmniAvatar模型这是一个创新的音频驱动全身视频生成模型 [1] - 该模型仅需输入一张图片和一段音频即可生成相应视频显著提升人物唇形同步细节和全身动作流畅性 [1] - 模型支持通过提示词精准控制人物姿势情绪场景等要素 [1] 行业应用 - 该技术突破在视频生成领域具有潜在应用价值可提升虚拟数字人在线教育娱乐等内容创作效率 [1]