CPU-AI推理用量提升-涨价或是必然
2026-01-22 10:43

行业与公司 * 行业:人工智能(AI)算力、数据中心、CPU/GPU/NPU等半导体芯片 * 涉及公司: * 国际:英伟达 (NVIDIA)、AMD、谷歌、台积电 * 国内:中科曙光、华为、海光信息、阿里巴巴(平头哥)、龙芯中科、飞腾信息、寒武纪、盛东信息、澜起科技 核心观点与论据 AI推理时代CPU的重要性提升 * Deepseek通过条件记忆和n-gram模块优化模型,并将n-gram嵌入表完全储存在CPU DRAM中,提升数据查询效率,凸显了CPU在推理过程中的协调和调度价值[1] * 在AGI时代,CPU的作用更加关键,核心器件(HBM、DDR、CPU)被重新定义[2] * 算力需求增加和技术迭代推动CPU出货量和价格双增[4] 技术演进与硬件配置趋势 * 英伟达的解决方案:推出Grace CPU,通过NVLink C2C技术将CPU与GPU间的数据搬运速度提高到900 Gbps,扩大GPU显存,并采用超级芯片封装技术(1颗CPU+2颗GPU)提高系统整体效率[1][5] * 国内企业进展: * 中科曙光发布STELLAR X64超级点,架构由160个CPU640颗GPU组成(当前1:4,未来或发展为1:2),采用海光X86架构授权和HASL总线互联协议[1][4][6] * 华为推出384超级点,采用自主研发的海光X86架构授权及HASL总线互联协议[1][6] * 华为在生成式AI领域采用340,384颗910C NPU192颗鲲鹏CPU,比例为1:2,使用Scuba网络[3][7] * 未来主流AI超算点配置:CPU数量(华为192颗、曙光160颗、AMD 18颗、ME 72颗);加速器比例(华为、英伟达为1:2,曙光、AMD暂为1:4);华为因使用灵渠协议,内存共享速度更快[8][9] * 迭代频率:华为生成式AI迭代频率高,预计到2026年第一季度达到Q4、Q7、Q8水平,对CPU和GPU需求量巨大[3][7] * 大模型技术趋势:对CPU三级缓存及GPU与CPU比例提出更高要求,从原来的1:4升级到1:2[12] 数据中心市场高速增长 * 预计到2030年,数据中心市场规模将达到600亿美元,增长由技术迭代、数据中心升级周期和头部CPU厂商持续更新推动[3][10] * 到2026年,服务器CPU出货量有望增加25%[11] * 台积电2025年总收入达3.81万亿新台币,同比增长31.6%,先进制程(3纳米和5纳米)营收占比显著提升[10] 国内外市场格局 * 海外:英伟达、AMD、谷歌等公司积极建设数据中心[11] * 国内:海光信息、中科曙光、华为、阿里巴巴等加紧布局[11] * CPU架构格局:国内相对集中,主要采用ARM架构(华为、阿里平头哥)与x86架构(海光信息代表);阿里平头哥还同时使用开源RISC-V架构[11] 其他重要内容(投资相关) * 推荐公司: * CPU领域:海光信息、龙芯中科、飞腾信息、中科曙光(因大模型技术迭代对缓存和CPU比例要求提升)[12] * AI芯片:海光信息、寒武纪[12] * 芯片互联:中科曙光、盛东信息、澜起科技(因互联需求增加)[12] * 服务器领域:中科曙光、海光信息[12]

CPU-AI推理用量提升-涨价或是必然 - Reportify