Workflow
S5000 单卡
icon
搜索文档
计算机行业重大事项点评:Token 推理大爆发,国产算力再迎海量需求
华创证券· 2026-03-02 20:02
行业投资评级 - 计算机行业评级为“推荐”(维持)[2] 报告核心观点 - 中国大模型Token推理调用量已超越美国,国产模型占据市场主导地位,这标志着AI应用从“问答工具”向“生产力工具”的深刻转变,并驱动算力需求从周期性训练投入转向持续性推理消耗[2][5] - 在推理负载常态化与海外高端算力供给受限的背景下,供给弹性不足与国产替代加速形成共振,产业利润有望向芯片设计与核心算力环节集中[5] 需求端分析:算力芯片进入高负载常态化阶段 - **Token消耗量激增**:2026年2月9日至15日,中国模型调用量达4.12万亿Token,首次超过美国模型的2.94万亿Token[2] - **国产模型主导市场**:2月16日至22日,平台调用量排名前五的模型中,四款来自中国厂商(MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5、DeepSeek V3.2),合计贡献Top5总调用量的85.7%[2] - **市场增长预测**:中国AI计算加速芯片市场规模预计从2024年的1,425.37亿元增至2029年的13,367.92亿元,年均复合增长率为53.7%[5] - **GPU细分市场**:GPU市场份额预计从2024年的69.9%提升至2029年的77.3%,市场规模达到10,333.40亿元[5] 供给端分析:海外约束强化与国产替代能力增强 - **海外供应紧张**: - 政策与产能双重限制导致供给弹性受限,自批准对华出口AI芯片两个月以来,英伟达尚未向中国售出任何H200芯片[5] - 美国商务部新规与国务院更严格限制立场并存,导致中国客户在许可条件不明朗前未下达订单[5] - 全球数据中心GPU交付周期长达36至52周,短期供给缺口持续存在[5] - **国产芯片替代能力增强**: - **性能突破**:摩尔线程S5000单卡FP8算力突破1,000 TFLOPS,训练精度与英伟达H100差距不到1%;华为预计2026年一季度发布昇腾950PR,算力同样达到1 PFLOPS(FP8)[5] - **生态适配加速**:自2025年12月至2026年3月,沐曦股份C500/C550已逐步适配腾讯混元图像3.0、阶跃星辰Step3.5flash、智谱GLM-5等多家国产大模型[5] - **商业兑现**:寒武纪、摩尔线程与沐曦股份2025年度业绩快报显示均实现三位数营业收入增长,其中寒武纪首度实现年度扭亏为盈[5] 投资建议 - **芯片设计**:建议关注寒武纪、海光信息、沐曦股份、摩尔线程、天数智芯[5] - **芯片代工**:建议关注中芯国际、华虹公司/华虹半导体[5] - **服务器及配套**:建议关注浪潮信息、华丰科技[5]