传媒行业动态跟踪:阿里视频生成模型登顶技术榜单,看好后续推理增强和Agent带动token用量加速
东方证券·2026-04-12 13:24

行业投资评级 - 传媒行业评级为“看好”(维持) [4] 报告核心观点 - 阿里视频生成模型登顶技术榜单,看好后续推理增强和Agent带动token用量加速 [1] - 应重视垂类多模态AI应用机会,看好技术突破、成本优化带来的产业趋势加速发展,将带动用户增长、付费渗透和商业化再上台阶 [2] - 尤其关注有多模态技术领先且商业化闭环的公司 [2] 行业动态与竞争格局 - 多模态竞争已常态化,市场更应关注技术的边际变化和单点能力强化 [6] - 近期阿里ATH旗下创新事业部的HappyHorse-1.0模型在Artificial Analysis视频生成模型榜单中登顶 [6] - 头部厂商模型迭代加速,例如快手可灵在25年4月至26年2月间从2.0版本快速迭代至3.0版本,即梦Seedance在25年6月至26年2月间从1.0版本迭代至2.0版本 [6] - 榜单霸主的更替是技术边际进步或单点强化的体现,能有效激励行业良性竞争,而非颠覆性的降维打击 [6] 厂商战略与技术趋势 - 多模态模型厂商的战略重心出现分化 [6] - OpenAI已宣布关停其AI视频生成模型Sora及相关服务,将战略重心转移至企业级生产力工具 [6] - Runway、Luma AI将叙事中心转向世界模型 [6] - 国内生数科技近期完成近20亿元融资,继续夯实通用世界模型能力,并与多家头部具身智能本体及模型公司达成战略合作 [6] - 当前“技术领先+商业闭环”率先跑通具备稀缺性优势,良性的变现模型和用户生态有助于模型厂商识别共性需求并针对性迭代 [6] 未来展望与驱动力 - 看好后续多模态模型推理能力增强、特定场景Agent落地带动token用量加速上行 [6] - 视频生成本质是有时间维度约束的图像生成,图像领域的技术突破可作为视频生成技术的预判 [6] - 图像领域的前沿技术是谷歌于25年12月发布的Nano Banana Pro,它基于Gemini主模型打造,引入类LLM思考链路,先理解语义与逻辑,结合世界知识,再执行像素生成 [6] - 未来多模态视频生成推理能力的增强将提升模型智能上限,结合特定场景工作流落地的Agent将带动多模态token用量进一步上行 [6] 投资建议与相关标的 - 相关投资标的包括:谷歌(ALPHABET)-A (GOOGL.O,未评级)、快手-W (01024,买入)、MINIMAX-WP (00100,未评级)、美图公司 (01357,买入) [2]

传媒行业动态跟踪:阿里视频生成模型登顶技术榜单,看好后续推理增强和Agent带动token用量加速 - Reportify