计算机行业事件点评：再谈CPU产业链重大机遇

行业投资评级 - 推荐维持评级 [8] 报告核心观点 - DeepSeek引领算力工程化优化，CPU重要性提升 [4] - 特定系统设计下，模型参数规模不再严格受限于GPU显存容量，CPU重要性有望大幅提升 [4][5] - AI Agent时代对CPU需求有望大幅增长，CPU可能比GPU更早成为瓶颈 [7][11] - CPU作为基础设施，其需求与供给之间的矛盾或将延续，龙头在供给侧出现短缺 [6] - 新型计算场景不断涌现，CPU等通用计算的重要性有望进一步凸显，其需求有望随AI发展而持续增加 [13] 技术趋势与工程突破 - DeepSeek官方GitHub仓库更新FlashMLA代码，发现此前未公开的模型架构标识"MODEL1"，共被提及31次 [4] - DeepSeek在论文中演示，成功将高达1000亿参数的Engram嵌入表完全存储在主机内存（CPU DRAM）中，而非GPU显存 [5] - 在1000亿参数规模下，通过PCIe通道异步搬运数据带来的额外推理延迟不到3% [5] - "存算分离"设计让推理速度仅下降2%，实现了千亿级别的知识容量扩展 [6] - CPU调用主存里的Engram表做哈希检索、筛选有效数据、异步传给GPU，比原来多了检索+数据转发负载的工作 [6] AI Agent发展对CPU的需求 - 根据英特尔论文，CPU上的工具处理会显著影响智能代理工作负载的执行延迟，占比最高达90.6% [7] - 智能代理AI工作负载的吞吐量受限于CPU相关因素（核心超配、缓存一致性、同步机制）和GPU相关因素 [7] - 在大批量处理场景下，CPU动态能耗占比会变得显著，达44% [7] - 进行Agent相关的强化学习时，需要海量CPU来构建各种工具和环境，CPU效能直接影响GPU利用率、训练稳定性及收敛速度 [11] - 根据IDC预测，活跃Agent数量将从2025年的约2860万，快速攀升至2030年的22.16亿 [12] - Agent年执行任务数将从2025年的440亿次增至2030年的415万亿次 [12] - 年度Token消耗将从2025年的0.0005 PetaTokens增至2030年的152,667 PetaTokens [12] CPU需求测算 - 截至2024年6月底，国内token日均消耗量30万亿，假设全年365天，则对应全年国内token消耗数为10950万亿 [12] - 2024年国内AI服务器出货量42万台 [12] - 单台AI服务器对应承担的token消耗数约为260亿，考虑到AI服务器通常配置2片CPU，则单片CPU承担的token消耗数约为130亿 [12] - 长期内，在Agent发展大趋势下，参考IDC对2030年的预测为长期水平，在保守/中性/乐观三种假设下，全球活跃Agent数量分别为11/22/33亿个 [12] - 对应全球Agent年执行任务数分别为2075000/4150000/6225000亿次 [12] - 对应全球年度Token消耗分别为76333500/152667000/229000500万亿 [12] - 对应需要CPU数量分别为586966/1173933/1760899万片 [12][14] 供给侧与产业瓶颈 - 以CPU龙头英特尔为例，Intel 10和Intel 7的产能限制，限制了其满足数据中心和客户端产品需求的能力 [6] - 由于需求持续超过供应，CPU短缺的情况可能会持续，英特尔预计短缺将在2026年第一季度达到顶峰 [6] - 英特尔不打算扩大这些节点的产能，这意味着随着需求的增长，产能限制仍将持续存在 [6] 投资建议与关注方向 - 建议重点关注CPU芯片：海光信息、禾盛新材、中国长城、龙芯中科等 [13] - 建议重点关注CPU先进晶圆制造：中芯国际等 [13] - 建议重点关注CPU相关解决方案：盛美上海、杰华特等 [13] - 建议重点关注CPU封测：通富微电等 [13] - 建议重点关注CPU配套芯片：澜起科技，聚辰股份 [13] - 建议重点关注CPU PCB：广合科技 [13] - 建议重点关注CPU电源、电感：中国长城、欧陆通、麦捷科技等 [13] - 建议重点关注鲲鹏CPU等服务器产业链：软通动力、神州数码等 [13]