传媒行业周报:腾讯开源定制化视频模型HunyuanCustom,Lightricks 发布最新AI视频生成模型
国盛证券·2025-05-11 18:23
【腾讯开源定制化视频模型 HunyuanCustom,擅长人物一致性和多模 态】5 月 9 日,腾讯混元开源多模态定制化视频模型 HunyuanCustom,专门 解决一致性问题,而且支持多模态输入。该模型基于混元模型,通过 LLaVA 图文对齐模块与身份增强系统,确保生成视频中人物形象跨场景、跨动作保 持高度统一。解决基本图文生成问题之后,HunyuanCustom 配备 AudioNet 音频驱动模块与视频条件注入系统,分别实现音频驱动和视频驱动的视频定 制。实测中,该模型在身份一致性(Face-Sim 和 DINO-Sim)、文字与视频 内容的匹配度(CLIP-B-T)和视频画面的时间连贯性(Temp-Consis)方面 均达到业界领先水平。 【Lightricks 正式发布最新 AI 视频生成模型——LTX Video 130 亿参数模 型】Lightricks 日前发布 130 亿参数 AI 视频生成模型 LTX Video(LTXV- 13B)。该模型在生成高质量 AI 视频方面较现有同类模型提升 30 倍,并且 能在消费级 GPU,如 RTX 3090、4090、5090 上运行,而无需依赖昂贵 ...