涉及的行业与公司 * 行业:半导体行业、AI计算行业、数据中心行业、信创产业[1][2][7] * 公司:英特尔(至强、智强系列)、AMD、海光、飞腾、鲲鹏、龙芯[2][7][12][14][15] 核心观点与论据:CPU需求激增的驱动因素 * AI发展导致供需失衡与供应链挤压 * AI推理需求增加,数据中心采购更多CPU,2025年Q1三大云厂商用于AI推理的至强级别芯片需求同比增长200%[1][7] * AI客户询单量在第一季度暴涨300%,但产能只能满足其中一小部分[1][2] * DRAM和NAND存储芯片需求激增,存储厂商抢购设备和材料,间接挤压了CPU厂商的产能扩张[1][2] * 新兴AI架构与技术显著增加CPU负担 * Ngram架构:采用分层存储,数据在DRAM、持久化内存和固态硬盘间的调度由CPU控制,当请求样本超过32时,CPU地址翻译耗时占延迟的1/3以上;内存寻址空间每增加100GB,CPU开销增加约18%[1][4] * 代理式AI与混合专家模型:MOE模型调度复杂度提高,长文本上下文机制将Q cache管理从GPU移至CPU,大幅增加CPU工作量[1][5] * Ingress架构:旨在降低GPU门槛,但导致系统CPU压力增大,GPU利用率从85%下降至40%[1][8] * 地缘战略与国产化需求 * 美国对华禁售高端GPU,促使国内探索用CPU集群进行推理,验证了32核CPU跑大语言模型的性价比[3] * 国内信创和AI新基建驱动国产化CPU需求,2027年党政信创要求接近100%国产化[7] * 部分省级政务中心明确要求CPU算力不低于GPU算力的1.5倍[1][7] * 能效优势与多领域需求衍生 * ARM架构CPU每处理一个token的排放量仅为A700 GPU的1/5,结合液冷技术可将PUE降至接近1.1[3] * 需求衍生效应包括服务器及存储服务器需求旺盛、边缘计算(如自动驾驶、智能制造)从16核升级到64核、消费端提前装机、车载、机器人、物联网等领域需求增加[2][7] 核心观点与论据:市场表现与核心矛盾 * 价格与供应紧张 * 英特尔智强处理器价格上涨12%到20%,部分型号交货周期拉长至18周[2] * 一季度现货价格上涨10%-15%,部分型号涨幅达20%-30%[7] * 海光专用型号溢价接近30%,交货周期明显拉长[1][7] * 国产CPU(如海光、飞腾)AI专用型号溢价高但仍脱销[2][12] * 当前市场核心矛盾 * 核心矛盾在于能够稳定运行新架构的CPU需求大幅增加,而不仅仅是供不应求[13] * 供应链预测误差,未能预见AI时代对高性能CPU需求的大幅增长[13] * 代工厂新产能被提前锁定,渠道商和ODM厂商提前锁单囤货,放大恐慌情绪[7][13] * 在党政和行业信创领域,国产CPU产能缺口更为明显[13] * 国产CPU表现与机遇 * 国产CPU(如鲲鹏、飞腾、龙芯)在具体计算场景中性能达英特尔志强8,460系列的六至七成,价格仅为其40%左右,性价比显著[2][15] * 在信创压力下迭代出高核数、大内存的新型CPU,为新架构提供良好支持[14][15] * 迎来了历史机遇,供应链安全成为新焦点[14] 其他重要内容:未来展望与缓解瓶颈的策略 * 未来需求将持续增长 * 海外三大云厂商计划未来三年CPU采购预算超过GPU预算的1.5倍[2][10] * 国内在信创和AI双轮驱动下,CPU需求将继续保持增长趋势[12] * 缓解系统瓶颈的优化策略 * CGAM策略:分批处理任务,如将120个任务分两批(每批64个)处理,可节省约1.5倍能耗,但每增加1%的吞吐,延迟增加15%左右[9][11] * 自适应策略:根据任务类型(如增强检索、代码执行、纯文本生成)选择最适合的处理器(GPU或CPU)[9][11] * 精细化调度优化:包括预分配专家权重减少跨节点访问、使用DMA引擎搬运数据、融合算子以减少内核切换效率损失[2][9] * AI时代计算系统性能提升趋势 * 性能提升主要依赖系统优化,而非单纯模型架构改进,数据搬运效率、调度及异构协同效率成为主要改进点[14] * 传统假设被打破:GPU越多越快不成立(当CPU成为瓶颈时);模型越小成本越低不成立(稀疏模型的CPU开销可能更高)[6]
CPU的复仇-被低估的协调效率
2026-01-22 10:43