行业投资评级 - 投资评级为 看好,评级为 维持 [6] 报告核心观点 - 报告核心观点是,随着阿里发布新一代旗舰模型 Qwen3.7-Max,行业正进入 AI 应用进行时,模型基座能力全面跃升,竞争焦点正从代码生成转向长期、稳定的任务执行(虚拟工程师),同时 芯模适配 趋势明显,系统级能力成为下一阶段比拼关键,这将推动商业化加速 [1][2][4][11] 模型能力总结 - Qwen3.7-Max 模型基座能力全面跃升:在 Arena 总榜位列国产第一,Agentic、推理、通用等能力持续突破 [2][4] - 编程智能体能力突出:在 Terminal Bench 2.0-Terminus 上取得最高 69.7 分,超过了 DeepSeek-V4-pro-Max、Claude-Opus 4.6 [11] - 通用智能体提升明显:在多项现实能力评测中表现优异,于 MCP-Atlas 等测试中超越 GLM-5.1、Kimi-K2.6,创下国产新高 [11] - 推理能力领先:在 GPQA Diamond、HLE 等核心推理测评中均超越 Claude-Opus 4.6 及所有国产模型 [11] - 通用与多语言能力增强:在指令遵循评测 IFBench 中得分突破新高达到 79.1 分 [11] - 模型能力演进方向:千问 3 系列持续强化编程、长上下文、工具调用、跨框架兼容和长程任务处理能力,模型正在从 回答问题 走向 执行任务 [11] 行业竞争与趋势分析 - 编程模型竞争阶段变化:下一阶段的模型竞争,不只是比谁写代码更快,而是比谁能让模型 长期、稳定地执行工程任务,模型需要从代码助手向 虚拟工程师 演进 [11] - 长程任务执行案例:阿里内部测试中,模型被放到新硬件平台平头哥真武 M890 上优化生产级注意力内核算子,实现 连续工作 35 小时,内核速度在参考实现基础上提升 一个数量级,且连续运行 30 小时后模型仍能发现新的优化空间 [11] - 当前模型价值转移:当前单纯生成代码的价值正在下降,更重要的是理解复杂代码仓库、自主调用工具、运行测试、修复错误,并在多轮反馈中持续调整 [11] - 行业竞争周期缩短:今年大模型行业的竞争周期正在明显缩短,架构创新加速、芯模适配越发明显,国产模型 Infra 能力迅速提升 [11] - 竞争阶段演进:模型从需求拐点走向需求差异化,再走向 系统级竞争,后续还会继续走向场景端生态端开拓,市场空间持续扩大 [11] 芯片适配与基础设施 - 平头哥发布新一代 AI 芯片:发布新一代训推一体 AI 芯片 真武 M890,算力底座全面升级 [11] - 芯片性能大幅跃升:采用自研并行计算架构,性能达上一代真武 810E 的 3 倍,内置 144GB 显存,片间互联带宽 800GB/s,原生支持 FP32–FP4 全精度 [11] - 集群能力领先:搭配自研 ICN Switch 1.0 互联芯片,128 张芯片组成单机,P2P 时延 <150ns,高效支撑 Agent 海量并发推理与大模型训练 [11] - 芯片路线规划:未来两年将推出 真武 V900、真武 J900 两代芯片 [11] - 芯片出货与客户:目前真武系列累计出货 56 万片,服务 20+ 行业,400+ 客户 [11] 商业化前景 - 阿里云竞争优势:阿里云凭借 “芯-云-模型-推理”全栈自研能力 和 Agentic 时代的先发布局,有望加速商业化兑现 [11]
AI应用进行时:Qwen3.7-Max发布,看好芯模适配与商业化加速