东吴证券：AI算力需求发生结构性分化 CPU多核化与需求放量进入确定性通道

AI Agent发展推动算力需求结构性分化 - 核心观点：AI发展从“纯对话”模型转向“执行任务”的智能体（Agent），导致算力需求发生结构性分化，CPU的重要性显著提升，从GPU的附属角色演变为需要单独规划的核心资源池 [1] - 具体分化体现在两个方面：1) 执行控制流CPU化：Agent行动阶段涉及大量if/else判断与系统调用，这类分支任务不适合GPU执行，会导致算力利用率急剧下降，而CPU架构长期优化于此 [1]；2) 记忆体系去GPU化：Agent长上下文推理产生巨大的KV cache，会快速耗尽GPU的HBM容量，CPU搭配大容量DDR5/LPDDR5并通过CXL扩展来承载KV Cache成为兼顾吞吐、扩展性与成本的主流架构 [1] CPU成为Agentic AI的性能瓶颈与需求驱动 - 研究数据显示，在完整的Agent执行链路中，工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6% [2] - 在高并发场景下（Batch Size提升至128），CPU端到端延迟从2.9秒跃升至6.3秒以上，系统吞吐瓶颈在于CPU的核心数并发调度问题，而非GPU计算能力 [2] - 随着Agent商业化推进，厂商需持续压低每次任务执行成本，超多核CPU凭借更高的并行度和更低的单位功耗，成为支撑大规模、长期运行Agent环境的关键 [3] 产业端软硬件基础设施加速演进 - 头部云服务提供商（CSP）如AWS和Google Cloud正在加速建设面向Agent的沙盒环境软硬件基础设施，强化软件层的隔离与编排能力，为CPU侧基础设施规模化部署奠定基础 [3] - CPU龙头厂商向超多核架构演进以应对Agent需求：AMD推出的Turin最高可达192核；Intel的Sierra Forest采用纯能效核设计，核心数可达144甚至288核 [3] - 英伟达在新架构中主动提升CPU配比，确认了在长上下文与高并发Agent场景中，大内存CPU是承载海量KV Cache的最优容器 [3] 相关投资机会 - 海光信息受益于Agentic AI推动CPU从调度走向高并发执行的核心算力地位抬升 [4] - 澜起科技受益于长上下文与高并发场景下CXL驱动的“存力+算力”协同升级 [4] - 建议关注龙芯中科、万通发展（数渡科技） [4]