芯模适配
搜索文档
AI应用进行时:Qwen3.7-Max发布,看好芯模适配与商业化加速
长江证券· 2026-05-25 08:44
行业投资评级 - 投资评级为 **看好**,评级为 **维持** [6] 报告核心观点 - 报告核心观点是,随着阿里发布新一代旗舰模型 **Qwen3.7-Max**,行业正进入 **AI 应用进行时**,模型基座能力全面跃升,竞争焦点正从代码生成转向长期、稳定的任务执行(虚拟工程师),同时 **芯模适配** 趋势明显,系统级能力成为下一阶段比拼关键,这将推动商业化加速 [1][2][4][11] 模型能力总结 - **Qwen3.7-Max 模型基座能力全面跃升**:在 Arena 总榜位列国产第一,Agentic、推理、通用等能力持续突破 [2][4] - **编程智能体能力突出**:在 Terminal Bench 2.0-Terminus 上取得最高 **69.7 分**,超过了 DeepSeek-V4-pro-Max、Claude-Opus 4.6 [11] - **通用智能体提升明显**:在多项现实能力评测中表现优异,于 MCP-Atlas 等测试中超越 GLM-5.1、Kimi-K2.6,创下国产新高 [11] - **推理能力领先**:在 GPQA Diamond、HLE 等核心推理测评中均超越 Claude-Opus 4.6 及所有国产模型 [11] - **通用与多语言能力增强**:在指令遵循评测 IFBench 中得分突破新高达到 **79.1 分** [11] - **模型能力演进方向**:千问 3 系列持续强化编程、长上下文、工具调用、跨框架兼容和长程任务处理能力,模型正在从 **回答问题** 走向 **执行任务** [11] 行业竞争与趋势分析 - **编程模型竞争阶段变化**:下一阶段的模型竞争,不只是比谁写代码更快,而是比谁能让模型 **长期、稳定地执行工程任务**,模型需要从代码助手向 **虚拟工程师** 演进 [11] - **长程任务执行案例**:阿里内部测试中,模型被放到新硬件平台平头哥真武 M890 上优化生产级注意力内核算子,实现 **连续工作 35 小时**,内核速度在参考实现基础上提升 **一个数量级**,且连续运行 30 小时后模型仍能发现新的优化空间 [11] - **当前模型价值转移**:当前单纯生成代码的价值正在下降,更重要的是理解复杂代码仓库、自主调用工具、运行测试、修复错误,并在多轮反馈中持续调整 [11] - **行业竞争周期缩短**:今年大模型行业的竞争周期正在明显缩短,架构创新加速、芯模适配越发明显,国产模型 Infra 能力迅速提升 [11] - **竞争阶段演进**:模型从需求拐点走向需求差异化,再走向 **系统级竞争**,后续还会继续走向场景端生态端开拓,市场空间持续扩大 [11] 芯片适配与基础设施 - **平头哥发布新一代 AI 芯片**:发布新一代训推一体 AI 芯片 **真武 M890**,算力底座全面升级 [11] - **芯片性能大幅跃升**:采用自研并行计算架构,性能达上一代真武 810E 的 **3 倍**,内置 **144GB 显存**,片间互联带宽 **800GB/s**,原生支持 FP32–FP4 全精度 [11] - **集群能力领先**:搭配自研 ICN Switch 1.0 互联芯片,128 张芯片组成单机,P2P 时延 **<150ns**,高效支撑 Agent 海量并发推理与大模型训练 [11] - **芯片路线规划**:未来两年将推出 **真武 V900**、**真武 J900** 两代芯片 [11] - **芯片出货与客户**:目前真武系列累计出货 **56 万片**,服务 **20+** 行业,**400+** 客户 [11] 商业化前景 - **阿里云竞争优势**:阿里云凭借 **“芯-云-模型-推理”全栈自研能力** 和 **Agentic 时代的先发布局**,有望加速商业化兑现 [11]