腾讯元宝上线AI视频生成能力

产品发布与核心参数 - 腾讯混元大模型团队于11月21日正式发布并开源轻量级视频生成模型HunyuanVideo 1.5 [1] - 该模型基于Diffusion Transformer架构,参数量为8.3B,支持生成5-10秒的高清视频 [1] - 模型能力已上线腾讯元宝最新版,用户可通过输入文字描述实现文生视频,或上传图片配合描述实现图生视频 [1] 核心功能与技术能力 - 模型具备全面核心能力,支持中英文输入的文生视频与图生视频,图生视频能力展现出图像与视频的高度一致性 [3] - 模型具备强指令理解与遵循能力,能精准实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令 [3] - 模型支持写实、动画、积木等多种风格,并可在视频中生成中英文文字 [3] - 模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质 [3] 模型性能对比 - 在文生视频任务中,HunyuanVideo 1.5对比Seedance pro胜率为+11.02%,对比Kling2.1胜率为+12.6%,对比Wan2.2胜率为+17.12% [4] - 在文生视频任务中,HunyuanVideo 1.5对比Veo3胜率为-10.32% [4] - 在图生视频任务中,HunyuanVideo 1.5对比Kling2.1胜率为+9.72%,对比Wan2.2胜率为+12.65% [4] - 在图生视频任务中,HunyuanVideo 1.5对比Veo3胜率为-3.61%,对比Seedance pro胜率为-5.77% [4]