Workflow
GRPO 算法
icon
搜索文档
为什么我们认为cpu的产业趋势才刚开始
2026-05-07 21:51
电话会议纪要研读总结 一、 涉及的行业与公司 * **行业**:AI计算产业、服务器CPU市场、AI模型后训练与推理环节 * **主要提及的上市公司**: * **国际**:英特尔 (Intel)、AMD、ARM、英伟达 (NVIDIA)、Anthropic、OpenAI * **A股**:海光信息、澜起科技、杰华特、广和通、合盛新材、龙芯中科、中国长城 二、 AI模型演进与CPU需求变化的核心观点 1. 模型范式演进:后训练成为CPU需求主战场 * 2025年后,AI模型发展从预训练、推理扩展转向**以后训练为主战场**[2] * 后训练决定模型能力向实际应用的转化效率,其投资回报率正变得越来越高[2] * 2026年,**Agent Scaling**(智能体强化学习规模化)将成为趋势,属于后训练的工程化和产业化应用,对应巨大的CPU需求[2] 2. CPU在AI各阶段角色演变:后训练环节成为瓶颈 * **预训练阶段**:CPU承担数据预处理、加载等辅助工作,非性能瓶颈[2] * **普通大模型后训练**:CPU任务相对简单,未构成瓶颈[2] * **Agent后训练**:CPU角色至关重要,需处理大量环境交互(工具调用、代码沙盒模拟、轨迹验证),环境延迟会拖慢整个进程,**使CPU成为瓶颈**[3] * **Agent推理阶段**:CPU负责真实执行工具调用、结果解析与状态管理,但目前**云服务提供商在推理侧尚未因Agent需求出现CPU大规模放量**[3][5] 3. 算法演进驱动资源需求重构:GRPO大幅提升CPU用量 * 强化学习算法从PPO演进至**GRPO**,核心是用大规模CPU Rollout采样取代“老师模型”,换取更高质量训练信号,节省GPU HBM占用[4][5] * GRPO同时进行**8个以上**的Rollout,相比PPO,其对CPU的用量实现了**接近十倍级别的扩张**[5] * **异步GRPO**成为标准配置,将并行采样规模从8个提升至**几十甚至上百个**,进一步拔高CPU用量上限[5] * 英伟达Vera体系(单颗CPU集成88个定制ARM核心)前瞻性体现了这一趋势,单核运行代码沙箱即可同步支持**2,250个Rollout**[5] 三、 当前CPU市场供需与价格趋势 1. 需求端:Agent驱动配比提升,需求强劲且前置 * 服务器**CPU/GPU配比**正从过去的**1:8**提升至**1:4**,并有望向**1:2甚至1:1**演进,主要由Agent应用带来的CPU用量增长驱动[1][7][8] * 当前由Agent驱动的CPU需求**主要由后训练环节主导**,模型训练对CPU的消耗在时间上先于推理侧[5] * 四家主要互联网公司在2026年4月底的财报中均**上修了2026年至2027年的资本开支**,预示强劲的长期需求[7][10] 2. 供给端:产能紧张,物料紧缺 * 供给端面临限制,无论是先进制程芯片还是英特尔自身的晶圆厂,都处于**物料紧缺状态**[7] * AMD与英特尔已将部分CPU SKU的价格提升了**10%至15%**,且**2026年全年的产能基本售罄**[1][12] 3. 价格趋势:涨价周期开启,预计持续 * CPU涨价趋势于**2026年Q1末(3月底至4月初)开启**,目前尚处初期[1][7][10] * 在需求猛增和供给受限的双重作用下,预计**涨价趋势将持续至2026年Q3乃至Q4**[1][7][10] * 市场可能**低估了CPU的短期涨价趋势**,但高估了其长期增长空间[1][6] 四、 主要厂商动态与基本面 1. AMD:上调市场预期,业绩超预期 * AMD已将服务器CPU的**潜在市场总额从约600亿美元上调至约1,200亿美元**[1][11] * 公司预期下一季度服务器CPU的营收同比增长将**超过70%**[1][11] * 2026年Q1财报显示,服务器CPU贡献了数据中心业务**超过70%**的收入[11] * 未来增长点在于**GPU业务环比增速**(MI350X/MI450)及CPU、GPU、机柜的全栈解决方案商业化进展[13] 2. 英特尔:供需缺口巨大,基本面现反转逻辑 * 英特尔透露,仅2026年Q2,因供给约束导致的潜在销售损失就达到**数十亿美元级别**,显示当前营收远未触及真实需求上限[8] * **18A制程的良率已超过内部预期**,14A制程成熟度表现更优,良率问题改善[1][9] * 先进封装订单年规模从**数亿美元跃升至数十亿美元**,为CSP定制的ASIC业务规模已**超过10亿美元**[9] * 芯片销量增长与晶圆代工业务良率提升,共同构成其**基本面的反转逻辑**[1][9] 五、 技术挑战与长期空间判断 1. 虚拟化技术效率提升存在限制 * 虚拟化技术是CPU硬件需求的负向beta,历史上曾化解对计算资源耗尽的担忧[6] * 当前Agent场景下,在线程级别运行容易引发**缓存污染**问题,状态切换需频繁从DRAM调取数据,代价高昂[6] * 预计沙箱在一段时间内仍会保持**独占1到2个核心**的模式,不能简单以1:1用量推算长期市场总规模[1][6] 2. 推理侧大规模放量尚未到来 * 目前除了Coding Agent,企业端并未观察到**大规模、重度的Agent应用**,Anthropic和OpenAI的企业级平台渗透率仍处初期[5] * 大量Coding Agent任务目前主要在**客户端运行**,消耗的是客户端级别CPU[5] * Compute-intensive use cases的相关体系仍在成熟过程中,因此市场**尚未进入Agent推理引发CPU大规模放量的阶段**[5][6] 六、 其他重要关注点 1. ARM与架构竞争 * 市场关注ARM对**ARM与x86架构份额竞争**的看法,以及其作为IP供应商对CPU市场容量的前瞻性指引[13] 2. A股产业链核心标的 * **芯片设计**: * 海光信息(x86架构,CPU/GPU产品客户端进展领先)[1][14] * 合盛新材(通过忆恒创源获得ARM授权)[14] * 龙芯中科(自研架构)[14] * 中国长城(通过飞腾信息布局ARM产品线)[14] * **零部件**: * 澜起科技(内存接口芯片)[1][14] * 杰华特(电源管理芯片)[1][14] * 广和通(为海外互联网厂商提供CPU相关PCB)[1][14]