Workflow
Agent-driven RL
icon
搜索文档
计算机行业点评:CPU涨价能持续多久?
国金证券· 2026-01-25 10:53
报告行业投资评级 * 报告未明确给出统一的行业投资评级,但通过详细分析行业趋势并列出大量相关标的,隐含了对该细分领域的积极看法 [4] 报告的核心观点 * 在Agent驱动的AI新时代,CPU正取代GPU成为算力基础设施的新短板,其需求将迎来爆发式增长 [6] * 三大核心逻辑驱动CPU刚性需求:Multi-Agent架构的OS调度压力、长上下文下的KV Cache卸载、高并发工具调用 [11] * Agent生态的指数级扩张将引爆CPU性能瓶颈,CPU在典型Agent工作负载中承担了大部分延迟 [16][21] * 产业供需失衡已经显现,英特尔、英伟达等巨头已采取行动应对CPU短缺,补足CPU短板是下阶段算力建设的重点 [33][37] 根据相关目录分别进行总结 一、三大逻辑揭示Agent对CPU的刚性需求 * **Multi-Agent架构带来操作系统调度压力**:Agent的“推理-执行-反思”闭环工作流导致操作系统层面的上下文切换和进程调度任务大幅增加,且运行隔离沙盒高度依赖CPU算力 [6][11] * **长上下文场景下KV Cache卸载挑战CPU**:为解决GPU显存容量瓶颈,业界采用KV Cache Offload技术将数据迁移至CPU内存,这要求CPU具备大内存并承担繁重的调度与传输任务 [6][11] * **高并发工具调用消耗大量CPU算力**:检索、编码、网页浏览等非模型推理任务主要由CPU执行,高并发场景下的多线程/多进程处理需求推高了CPU负载 [6][15] 二、Agent生态扩张引爆CPU性能瓶颈 * **Agent生态将经历指数级扩张**:据IDC预测,2025年至2030年间,活跃Agent数量、年执行任务量及年度Token消耗量的年复合增长率将分别达到139%、524%和3418% [6][16][17] * **CPU是Agent工作负载的主要延迟来源**:研究显示,在五大代表性Agent工作负载中,CPU端的工具处理占延迟的43.8%至90.6%,而LLM推理仅占较小部分,例如HaystackRAG任务中CPU耗时占比达90.6% [6][21] * **CPU能耗随负载增加而急剧上升**:在处理LangChain工作负载时,当Batch Size增加到128,CPU的能耗(1807 Joules)已非常接近GPU(2307 Joules) [27] * **新架构推动“以存代算”**:如DeepSeek的Engram架构将1000亿参数的表存储运行在CPU内存中,仅产生小于3%的开销,这类架构将推动对CPU内存和算力的需求 [6][32] 三、供需失衡全面爆发,算力木桶新短板已现 * **产业巨头紧急调整应对CPU瓶颈**:英特尔将产能紧急转向服务器CPU导致消费端交付受阻;英伟达因ARM CPU瓶颈,计划在下一代Rubin架构中大幅提升CPU核心数,并开放对x86 CPU的支持 [6][33] * **服务器与客户端CPU需求同步强劲增长**:Jon Peddie Research报告显示,2025年第二季度全球服务器CPU出货量同比增长22%,客户端CPU出货量同比增长13%,且已连续两个季度增长 [6][33] * **供应短缺持续**:英特尔CFO表示预计2026年第一季度可用供应将降至最低水平,公司正应对整个行业的供应短缺 [37] * **CPU成为算力新短板**:报告认为,在Agent时代,CPU已演变为类似存储的新短板,补足这一短板是下一阶段算力基础设施建设的重中之重 [6][37] 四、相关标的 * **CPU相关**:报告列出了包括海光信息、中科曙光、龙芯中科等在内的标的 [4][38] * **国内算力相关**:报告列出了包括寒武纪、中芯国际、浪潮信息、百度集团等在内的广泛标的 [4][38] * **海外算力/存储相关**:报告列出了包括中际旭创、新易盛、兆易创新、北方华创等在内的标的 [4][38]