报告行业投资评级 * 报告未明确给出统一的行业投资评级,但通过列举大量相关标的并分析行业趋势,隐含了对AI Agent、算力、存储及CPU等细分领域的积极看法 [4] 报告核心观点 * AI Agent生态持续扩张,正从简单的对话模型向能并行处理复杂任务的智能体集群演进,这将重塑计算架构,并催生对CPU和存储的新一轮刚性需求 [6] * 在Agent驱动的强化学习时代,计算瓶颈正从GPU向CPU转移,主要源于多智能体调度、长上下文KV缓存卸载以及高并发工具调用三大逻辑 [6] * Agent的执行过程需要大量记忆和上下文缓存,推动了存储需求增长,利用SSD进行KV缓存卸载成为解决GPU显存瓶颈、提升推理性能的关键技术路径 [6] * DeepSeek的Engram等“以存代算”架构通过解耦计算与记忆,进一步凸显了CPU和大容量内存的重要性 [6] 根据相关目录分别总结 一、Agent生态持续扩张 * 大模型公司Anthropic大幅上调营收预测,预计今年销售额将增长四倍达180亿美元,明年达550亿美元,其AI编码助手Claude Code在去年11月的年化收入已超过10亿美元 [6][11] * 月之暗面发布并开源K2.5模型,其核心亮点是支持多达100个Agent分身并行处理1500个步骤,能自主完成如阅读40篇论文并撰写长篇综述的复杂任务 [6][12] * AI助手Clawdbot近期爆火,能接管个人终端的邮件、日历、值机等各类任务,并通过常用聊天APP发送指令,其“贾维斯”式体验为Agent形态打开了新思路,吸引了腾讯云、阿里云等厂商快速接入 [6][14][15] 二、三大逻辑揭示Agent对CPU的刚性需求 * Multi-Agent架构引发OS调度压力:Agent的“推理-执行-反思”循环机制需要操作系统频繁调度,且其运行常依赖CPU算力密集的沙盒环境 [6][16] * 长上下文场景下KV Cache卸载对CPU的挑战:为解决GPU显存瓶颈,业界将KV Cache数据迁移至CPU内存,这要求CPU具备大内存并承担繁重的调度与传输任务 [6][16] * 高并发工具调用带来的CPU算力消耗:检索、编码等非模型推理任务主要由CPU执行,高并发场景下多线程/多进程处理推高了CPU负载 [6][20] * 佐治亚理工学院论文数据显示,在五大代表性Agent工作负载中,CPU端的工具处理占延迟的43.8%至90.6%,而LLM推理仅占较小部分,例如HaystackRAG任务中检索耗时8.0秒占总延迟90.6% [21] 三、Agent驱动存储需求持续增长 * Agent的执行过程需要记忆和上下文缓存,对存储带来巨大需求,利用SSD进行KV Cache Offloading可解决GPU显存瓶颈、提高推理性能并降低成本 [6][31] * 在Agent多轮对话环境中,将KV缓存卸载至NVMe SSD等共享存储,可实现跨节点快速恢复,避免会话迁移时重新预填充引入的高延迟 [36] * 美国存储厂商近期业绩亮眼:希捷第二财季营收同比增长22%至28.3亿美元,并给出高于市场预期的下季度指引 [40];闪迪第二财季营收达30.25亿美元,同比增长61%,GAAP净利润同比增长672%至8.03亿美元,并预计数据中心将在2026年首次成为NAND最大市场 [41] 四、相关标的 * 报告列出了覆盖海外算力/存储、国内算力、CPU等多个赛道的广泛标的清单,包括中际旭创、新易盛、兆易创新、海光信息、中科曙光、澜起科技、闪迪、美光等数十家公司 [4][42]
计算机:AI进入新临界点
国金证券·2026-02-01 18:29