纪要涉及的行业或公司 * 行业:AI Agent(人工智能代理)、CPU(中央处理器)产业链、云计算、服务器制造[1][2][3][4][5][6] * 公司: * CPU设计/供应商:英特尔、AMD、海光信息、龙芯中科[1][2][19][22][23][24] * 服务器制造商/ODM:浪潮信息、华勤、中科曙光[2][23][24][25] * 云计算厂商:阿里巴巴(阿里云)、腾讯(腾讯云)、优刻得(UCloud)、AWS[2][5][6][22][24] * CPU供应链:和胜新材、中国长城、创意电子(GUC)、兴森科技(载板)[23][24][25] 核心观点和论据 * 核心观点一:AI Agent的兴起将驱动CPU需求呈指数级增长,而非线性增长[1][14][16][17][21] * 论据1(需求来源):AI Agent任务范式从“推理-执行”(COT)转向“推理-执行-反思”,导致任务执行轮次和并行任务数量(步长)增加,CPU成为系统瓶颈,GPU利用率受制于CPU返回结果的速度[14][15] * 论据2(数据支撑):引用英特尔论文,在5个代表性Agent工作负载(如问答检索、数学计算、代码生成)中,CPU处理时间占比最高可达90%,远超GPU推理时间(仅10%)[7][8][9] * 论据3(增长模型):CPU需求增长与三个线性因素相乘相关:1) AI Agent渗透率;2) AI Agent任务步长;3) 工具调用频率。三者共同作用形成指数效应[16][17] * 核心观点二:CPU供应紧张,涨价趋势明确且可能持续一年以上,幅度可观[1][4][14][19][20][21] * 论据1(供应瓶颈): * 英特尔:受自身先进封装产能良率问题限制[1] * AMD及云厂商自研ARM CPU:受制于台积电先进制程(3纳米、5纳米)产能向GPU倾斜[1][20] * 整体:Q1库存消耗后供应全年紧俏,载板等供应链扩产需要周期[2][3][4] * 论据2(涨价预期):产业链调研显示,高性能X86 CPU涨价幅度为“可观的双位数”;整体涨价趋势被类比为“存储2.0”,但更温和稳定,预计持续超一年[14][19][21] * 核心观点三:CPU需求增长不仅体现在AI服务器,更大量体现在通用服务器[2][3][17][18] * 论据:以微软为例,其采购NVIDIA AI服务器,CPU需求增长完全来自通用服务器。因为Agent任务瓶颈在于CPU开销(核数与数量),而非通信带宽,可通过增加通用服务器或CPU资源池形式解决[17][18][19] * 核心观点四:CPU及存储涨价将传导至云计算服务,引发云服务涨价潮[2][21][22] * 论据1(成本压力):CPU、存储等硬件成本上涨给云厂商带来成本压力[21] * 论据2(传导动力与先例):云厂商有动力传导成本;海外AWS已上调GPU实例价格,为行业涨价开了头[22] * 论据3(预期):国内阿里云、腾讯云等厂商涨价“只是时间问题”,将带来利润率修复[2][5][22] * 核心观点五:投资机会沿产业链自上而下展开,CPU自身产业链最核心[23][24][25] * 第一梯队(CPU产业链):国内看好海光信息(受益于供应紧张及市场化拓展)、中科曙光(持股海光+ODM);海外关注AMD、英特尔;供应链关注载板(如兴森科技)等[22][23][24][25] * 第二梯队(云计算):首推阿里巴巴,其次关注弹性较大的中小云厂商[24][25] * 第三梯队(服务器制造):浪潮信息、华勤等因CPU服务器毛利率更高而间接受益[23][24][25] 其他重要内容 * 需求量化展望:预计到2026年,CPU需求增长幅度可能达到15%-20%,甚至30%-40%(两位数增长),而非此前预期的大个位数增长[19] * 技术细节佐证: * 吞吐量瓶颈:英特尔论文指出,当处理批次大小(Batch Size)达到128时,系统出现严重的CPU上下文切换瓶颈,限制吞吐量进一步提升[9][10] * 能耗变化:在复杂Agent任务中,随着Batch Size增大,CPU能耗急剧上升,当Batch Size为128时,CPU能耗已接近GPU能耗[10][11] * KV Cache卸载:长上下文和KV Cache从HBM卸载到DRAM/SSD的过程,增加了GPU与CPU间的数据搬运需求,对通信带宽要求提高[16] * 市场认知差:强调AI Agent对CPU的拉动是“指数级”增长,与市场其他观点可能存在的线性预期不同[1][21] * 国内产业动态: * 阿里“通义千问”打通应用生态,内部调动大量CPU资源;预期腾讯、字节等将跟进推出类似超级入口[5][6] * 海光信息被看好从“信创市场”成功拓展至更广阔的行业及民营企业市场,成长天花板有望翻倍[22][23]
CPU涨价会持续多久