计算机行业事件点评:再谈CPU产业链重大机遇
国联民生证券·2026-01-21 23:23

行业投资评级 - 推荐 维持评级 [8] 报告核心观点 - DeepSeek引领算力工程化优化,CPU重要性提升 [4] - 特定系统设计下,模型参数规模不再严格受限于GPU显存容量,CPU重要性有望大幅提升 [4][5] - AI Agent时代对CPU需求有望大幅增长,CPU可能比GPU更早成为瓶颈 [7][11] - CPU作为基础设施,其需求与供给之间的矛盾或将延续,龙头在供给侧出现短缺 [6] - 新型计算场景不断涌现,CPU等通用计算的重要性有望进一步凸显,其需求有望随AI发展而持续增加 [13] 技术趋势与工程突破 - DeepSeek官方GitHub仓库更新FlashMLA代码,发现此前未公开的模型架构标识"MODEL1",共被提及31次 [4] - DeepSeek在论文中演示,成功将高达1000亿参数的Engram嵌入表完全存储在主机内存(CPU DRAM)中,而非GPU显存 [5] - 在1000亿参数规模下,通过PCIe通道异步搬运数据带来的额外推理延迟不到3% [5] - "存算分离"设计让推理速度仅下降2%,实现了千亿级别的知识容量扩展 [6] - CPU调用主存里的Engram表做哈希检索、筛选有效数据、异步传给GPU,比原来多了检索+数据转发负载的工作 [6] AI Agent发展对CPU的需求 - 根据英特尔论文,CPU上的工具处理会显著影响智能代理工作负载的执行延迟,占比最高达90.6% [7] - 智能代理AI工作负载的吞吐量受限于CPU相关因素(核心超配、缓存一致性、同步机制)和GPU相关因素 [7] - 在大批量处理场景下,CPU动态能耗占比会变得显著,达44% [7] - 进行Agent相关的强化学习时,需要海量CPU来构建各种工具和环境,CPU效能直接影响GPU利用率、训练稳定性及收敛速度 [11] - 根据IDC预测,活跃Agent数量将从2025年的约2860万,快速攀升至2030年的22.16亿 [12] - Agent年执行任务数将从2025年的440亿次增至2030年的415万亿次 [12] - 年度Token消耗将从2025年的0.0005 PetaTokens增至2030年的152,667 PetaTokens [12] CPU需求测算 - 截至2024年6月底,国内token日均消耗量30万亿,假设全年365天,则对应全年国内token消耗数为10950万亿 [12] - 2024年国内AI服务器出货量42万台 [12] - 单台AI服务器对应承担的token消耗数约为260亿,考虑到AI服务器通常配置2片CPU,则单片CPU承担的token消耗数约为130亿 [12] - 长期内,在Agent发展大趋势下,参考IDC对2030年的预测为长期水平,在保守/中性/乐观三种假设下,全球活跃Agent数量分别为11/22/33亿个 [12] - 对应全球Agent年执行任务数分别为2075000/4150000/6225000亿次 [12] - 对应全球年度Token消耗分别为76333500/152667000/229000500万亿 [12] - 对应需要CPU数量分别为586966/1173933/1760899万片 [12][14] 供给侧与产业瓶颈 - 以CPU龙头英特尔为例,Intel 10和Intel 7的产能限制,限制了其满足数据中心和客户端产品需求的能力 [6] - 由于需求持续超过供应,CPU短缺的情况可能会持续,英特尔预计短缺将在2026年第一季度达到顶峰 [6] - 英特尔不打算扩大这些节点的产能,这意味着随着需求的增长,产能限制仍将持续存在 [6] 投资建议与关注方向 - 建议重点关注CPU芯片:海光信息、禾盛新材、中国长城、龙芯中科等 [13] - 建议重点关注CPU先进晶圆制造:中芯国际等 [13] - 建议重点关注CPU相关解决方案:盛美上海、杰华特等 [13] - 建议重点关注CPU封测:通富微电等 [13] - 建议重点关注CPU配套芯片:澜起科技,聚辰股份 [13] - 建议重点关注CPU PCB:广合科技 [13] - 建议重点关注CPU电源、电感:中国长城、欧陆通、麦捷科技等 [13] - 建议重点关注鲲鹏CPU等服务器产业链:软通动力、神州数码等 [13]