模算协同 - 财报，业绩电话会，研报，新闻

模算协同

搜索文档

国联民生证券· 2026-06-22 17:30

报告行业投资评级 - 行业评级为“推荐” [4] 报告核心观点 - 报告认为，“模算协同”（即国产大模型与国产芯片的深度协同）是中国的伟大机遇，国产大模型叠加国产芯片的产业趋势正逐渐显现 [1][6] - 国产大模型自主可控发展的战略紧迫性持续凸显，海外AI技术管控升级进一步夯实了国产大模型产业的长期成长逻辑 [6] - 当前国产AI产业正处于模型性能迭代、全栈算力适配、开源生态完善的共振发展阶段，“模算协同”趋势下产业链长期成长逻辑持续强化 [7] 事件概述与模型技术突破 - 智谱发布GLM-5.2模型，定位为面向长程任务的智能体基座模型，核心具备三大特性 [6] - 实现1M（百万）无损上下文，解决传统大模型长上下文性能衰减问题 [6] - 创新提出IndexShare机制，优化原生DeepSeek稀疏注意力架构，提升超长上下文推理效率与响应速度 [6] - 编程能力对齐Claude Opus 4.8，在SWE-bench Pro、MCP-Atlas基准测试中分别取得62.1、81.0的开源模型最高分，性能超过GPT-5.5 [6] - 华为昇腾针对DSA架构瓶颈，基于MindSpeed LLM大模型套件实现三大DSA融合算子，带来显著性能优化 [6] - 在64K上下文场景下，实现算子时延最高降低72%，中间张量显存峰值最高降低65% [6] - 片上内存带宽利用率从40%提升至90%，Cube/Vector双核利用率从55%提升至90%以上 [6] - 在4K序列长度下，单步迭代耗时从112秒缩短至84秒，显存占用降低27% [6] - GLM-5.2实现了技术性能、全栈国产算力适配与开源生态的关键突破，已覆盖华为昇腾、平头哥等八大国产芯片厂商 [6] 国产算力适配与性能验证 - 昇腾A3超节点方案已验证大模型推理落地能力，目前已实现DeepSeek V4-Flash模型单卡Decode吞吐2000+ TPS，可满足行业超高吞吐、大并发推理需求 [6] - 除昇腾外，寒武纪也实现了DeepSeek-V4-flash（285B参数）与DeepSeek-V4-pro（1.6T参数）两款模型的Day0适配，适配代码已开源 [3] - DeepSeek V4模型提出的FP4（MXFP4）量化方案已获昇腾950系列全系支持，寒武纪也已落地适配，随着下半年昇腾950超节点批量上市，大模型推理成本有望大幅下调 [7] 投资建议 - 报告建议关注三大方向 [7] - 国产大模型产业链：如智谱、MiniMax与宏景科技等配套算力服务商 [7] - 国产算力：如寒武纪、海光信息、云天励飞等 [7] - 主权AI建设需求利好的AI Infra厂商：如浪潮信息等 [7]