行业投资评级 - 计算机行业评级为“推荐”(维持)[2] 报告核心观点 - 中国大模型Token推理调用量已超越美国,国产模型占据市场主导地位,这标志着AI应用从“问答工具”向“生产力工具”的深刻转变,并驱动算力需求从周期性训练投入转向持续性推理消耗[2][5] - 在推理负载常态化与海外高端算力供给受限的背景下,供给弹性不足与国产替代加速形成共振,产业利润有望向芯片设计与核心算力环节集中[5] 需求端分析:算力芯片进入高负载常态化阶段 - Token消耗量激增:2026年2月9日至15日,中国模型调用量达4.12万亿Token,首次超过美国模型的2.94万亿Token[2] - 国产模型主导市场:2月16日至22日,平台调用量排名前五的模型中,四款来自中国厂商(MiniMax M2.5、月之暗面Kimi K2.5、智谱GLM-5、DeepSeek V3.2),合计贡献Top5总调用量的85.7%[2] - 市场增长预测:中国AI计算加速芯片市场规模预计从2024年的1,425.37亿元增至2029年的13,367.92亿元,年均复合增长率为53.7%[5] - GPU细分市场:GPU市场份额预计从2024年的69.9%提升至2029年的77.3%,市场规模达到10,333.40亿元[5] 供给端分析:海外约束强化与国产替代能力增强 - 海外供应紧张: - 政策与产能双重限制导致供给弹性受限,自批准对华出口AI芯片两个月以来,英伟达尚未向中国售出任何H200芯片[5] - 美国商务部新规与国务院更严格限制立场并存,导致中国客户在许可条件不明朗前未下达订单[5] - 全球数据中心GPU交付周期长达36至52周,短期供给缺口持续存在[5] - 国产芯片替代能力增强: - 性能突破:摩尔线程S5000单卡FP8算力突破1,000 TFLOPS,训练精度与英伟达H100差距不到1%;华为预计2026年一季度发布昇腾950PR,算力同样达到1 PFLOPS(FP8)[5] - 生态适配加速:自2025年12月至2026年3月,沐曦股份C500/C550已逐步适配腾讯混元图像3.0、阶跃星辰Step3.5flash、智谱GLM-5等多家国产大模型[5] - 商业兑现:寒武纪、摩尔线程与沐曦股份2025年度业绩快报显示均实现三位数营业收入增长,其中寒武纪首度实现年度扭亏为盈[5] 投资建议 - 芯片设计:建议关注寒武纪、海光信息、沐曦股份、摩尔线程、天数智芯[5] - 芯片代工:建议关注中芯国际、华虹公司/华虹半导体[5] - 服务器及配套:建议关注浪潮信息、华丰科技[5]
计算机行业重大事项点评:Token 推理大爆发,国产算力再迎海量需求
华创证券·2026-03-02 20:02