腾讯元宝上线视频生成能力
产品发布与核心能力 - 公司于11月21日正式发布并开源HunyuanVideo 1.5模型,该模型基于Diffusion Transformer架构,参数量为8.3B,是一款轻量级视频生成模型 [1] - 模型支持生成5-10秒的高清视频,用户可通过输入文字描述实现文生视频,或上传图片配合文字描述将静态图片转化为动态视频 [1] - 模型具备全面核心能力,支持中英文输入的文生视频与图生视频,图生视频能力展现出图像与视频的高度一致性 [4] - 模型具备强指令理解与遵循能力,能精准实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令,并支持写实、动画、积木等多种风格 [4] 技术规格与画质 - 模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质 [4] - 模型还支持在生成的视频中嵌入中英文文字 [4] 性能基准对比 - 在文生视频任务GSB评测中,相较于Seedance pro模型,HunyuanVideo胜率为+11.02% [6] - 在文生视频任务GSB评测中,相较于Kling2.1模型,HunyuanVideo胜率为+12.6% [6] - 在文生视频任务GSB评测中,相较于Wan2.2模型,HunyuanVideo胜率为+17.12% [6] - 在图生视频任务GSB评测中,相较于Kling2.1模型,HunyuanVideo胜率为+9.72% [6] - 在图生视频任务GSB评测中,相较于Wan2.2模型,HunyuanVideo胜率为+12.65% [6]