阿里视频生成模型登顶技术榜单,看好后续推理增强和Agent带动token用量加速
东方证券·2026-04-12 11:15

行业投资评级 - 传媒行业评级为“看好”(维持) [4] 报告核心观点 - 核心观点:应重视垂类多模态AI应用机会,看好技术突破与成本优化将加速产业发展,带动用户增长、付费渗透和商业化提升,尤其关注多模态技术领先且已形成商业化闭环的公司 [2] - 阿里旗下创新事业部的视频生成模型HappyHorse-1.0在Artificial Analysis榜单登顶,但多模态竞争自2025年下半年以来已常态化,当前更应关注技术边际进步和单点能力强化,而非格局恶化 [6] - 多模态模型厂商战略重心出现分化,部分厂商转向企业级工具或世界模型,在此背景下,同时具备技术领先和商业闭环能力的公司具有稀缺性优势 [6] - 看好未来多模态模型推理能力增强以及特定场景Agent的落地,这将带动多模态token用量加速上行 [1][6] 行业动态与竞争格局 - 多模态竞争激烈,头部厂商模型迭代加速,例如快手可灵在不到一年内从2.0版本(2025年4月)迭代至3.0版本(2026年2月),即梦Seedance也从1.0版本(2025年6月)迭代至2.0版本(2026年2月) [6] - 部分厂商战略调整:OpenAI关停其AI视频生成模型Sora及相关服务,将重心转向企业级生产力工具;Runway、Luma AI转向世界模型叙事;国内生数科技近期完成近20亿元融资,继续夯实通用世界模型能力 [6] 技术发展趋势 - 视频生成技术前沿借鉴图像领域突破,例如2025年12月谷歌发布的Nano Banana Pro模型,引入了类LLM的思考链路,先理解语义与逻辑,再执行像素生成,这预示着未来多模态视频生成模型的推理能力将增强 [6] - 视频生成本质是有时间维度约束的图像生成,图像领域的技术突破可作为视频生成技术的预判 [6] 投资建议与相关标的 - 投资建议:重视垂类多模态AI应用机会,关注技术领先且商业化闭环的公司 [2] - 相关标的:谷歌(ALPHABET)-A(GOOGL.O,未评级)、快手-W(01024,买入)、MINIMAX-WP(00100,未评级)、美图公司(01357,买入) [2]

阿里视频生成模型登顶技术榜单,看好后续推理增强和Agent带动token用量加速 - Reportify