东吴证券:AI算力需求发生结构性分化 CPU多核化与需求放量进入确定性通道
东吴证券东吴证券(SH:601555) 智通财经网·2026-01-28 15:13

AI Agent发展推动算力需求结构性分化 - 核心观点:AI发展从“纯对话”模型转向“执行任务”的智能体(Agent),导致算力需求发生结构性分化,CPU的重要性显著提升,从GPU的附属角色演变为需要单独规划的核心资源池 [1] - 具体分化体现在两个方面:1) 执行控制流CPU化:Agent行动阶段涉及大量if/else判断与系统调用,这类分支任务不适合GPU执行,会导致算力利用率急剧下降,而CPU架构长期优化于此 [1];2) 记忆体系去GPU化:Agent长上下文推理产生巨大的KV cache,会快速耗尽GPU的HBM容量,CPU搭配大容量DDR5/LPDDR5并通过CXL扩展来承载KV Cache成为兼顾吞吐、扩展性与成本的主流架构 [1] CPU成为Agentic AI的性能瓶颈与需求驱动 - 研究数据显示,在完整的Agent执行链路中,工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6% [2] - 在高并发场景下(Batch Size提升至128),CPU端到端延迟从2.9秒跃升至6.3秒以上,系统吞吐瓶颈在于CPU的核心数并发调度问题,而非GPU计算能力 [2] - 随着Agent商业化推进,厂商需持续压低每次任务执行成本,超多核CPU凭借更高的并行度和更低的单位功耗,成为支撑大规模、长期运行Agent环境的关键 [3] 产业端软硬件基础设施加速演进 - 头部云服务提供商(CSP)如AWS和Google Cloud正在加速建设面向Agent的沙盒环境软硬件基础设施,强化软件层的隔离与编排能力,为CPU侧基础设施规模化部署奠定基础 [3] - CPU龙头厂商向超多核架构演进以应对Agent需求:AMD推出的Turin最高可达192核;Intel的Sierra Forest采用纯能效核设计,核心数可达144甚至288核 [3] - 英伟达在新架构中主动提升CPU配比,确认了在长上下文与高并发Agent场景中,大内存CPU是承载海量KV Cache的最优容器 [3] 相关投资机会 - 海光信息受益于Agentic AI推动CPU从调度走向高并发执行的核心算力地位抬升 [4] - 澜起科技受益于长上下文与高并发场景下CXL驱动的“存力+算力”协同升级 [4] - 建议关注龙芯中科、万通发展(数渡科技) [4]