模算协同
搜索文档
计算机行业事件点评:“模算协同”将是中国的伟大机遇:“国模+国芯”
国联民生证券· 2026-06-22 17:30
报告行业投资评级 - 行业评级为“推荐” [4] 报告核心观点 - 报告认为,“模算协同”(即国产大模型与国产芯片的深度协同)是中国的伟大机遇,国产大模型叠加国产芯片的产业趋势正逐渐显现 [1][6] - 国产大模型自主可控发展的战略紧迫性持续凸显,海外AI技术管控升级进一步夯实了国产大模型产业的长期成长逻辑 [6] - 当前国产AI产业正处于模型性能迭代、全栈算力适配、开源生态完善的共振发展阶段,“模算协同”趋势下产业链长期成长逻辑持续强化 [7] 事件概述与模型技术突破 - 智谱发布GLM-5.2模型,定位为面向长程任务的智能体基座模型,核心具备三大特性 [6] - 实现1M(百万)无损上下文,解决传统大模型长上下文性能衰减问题 [6] - 创新提出IndexShare机制,优化原生DeepSeek稀疏注意力架构,提升超长上下文推理效率与响应速度 [6] - 编程能力对齐Claude Opus 4.8,在SWE-bench Pro、MCP-Atlas基准测试中分别取得62.1、81.0的开源模型最高分,性能超过GPT-5.5 [6] - 华为昇腾针对DSA架构瓶颈,基于MindSpeed LLM大模型套件实现三大DSA融合算子,带来显著性能优化 [6] - 在64K上下文场景下,实现算子时延最高降低72%,中间张量显存峰值最高降低65% [6] - 片上内存带宽利用率从40%提升至90%,Cube/Vector双核利用率从55%提升至90%以上 [6] - 在4K序列长度下,单步迭代耗时从112秒缩短至84秒,显存占用降低27% [6] - GLM-5.2实现了技术性能、全栈国产算力适配与开源生态的关键突破,已覆盖华为昇腾、平头哥等八大国产芯片厂商 [6] 国产算力适配与性能验证 - 昇腾A3超节点方案已验证大模型推理落地能力,目前已实现DeepSeek V4-Flash模型单卡Decode吞吐2000+ TPS,可满足行业超高吞吐、大并发推理需求 [6] - 除昇腾外,寒武纪也实现了DeepSeek-V4-flash(285B参数)与DeepSeek-V4-pro(1.6T参数)两款模型的Day0适配,适配代码已开源 [3] - DeepSeek V4模型提出的FP4(MXFP4)量化方案已获昇腾950系列全系支持,寒武纪也已落地适配,随着下半年昇腾950超节点批量上市,大模型推理成本有望大幅下调 [7] 投资建议 - 报告建议关注三大方向 [7] - 国产大模型产业链:如智谱、MiniMax与宏景科技等配套算力服务商 [7] - 国产算力:如寒武纪、海光信息、云天励飞等 [7] - 主权AI建设需求利好的AI Infra厂商:如浪潮信息等 [7]