GenAI革命
搜索文档
深度解读英伟达芯片路线图
半导体行业观察· 2026-03-20 08:56
英伟达产品路线图演进 - 公司在2012年至2017年间定期发布数据中心GPU路线图,但随后数年路线图转为内部保密,直到2023年底才重新发布新时代路线图[2] - 2023年10月的路线图首次揭示了人工智能系统组件的年度更新计划,当时2025年产品曾用代号GX200、GX200NVL、X100和X40,后证实为“Blackwell”GPU[3] - 公司在2024年6月公布了到2027年的数据中心路线图,引入了“Vera”CV100 Arm服务器CPU和“Rubin”R200 GPU加速器,随后在GTC大会上更新了到2028年的路线图[3] 市场地位与财务预测 - 公司在人工智能训练领域占据绝对优势,在推理领域也具备竞争力[4] - 根据IDC和Gartner数据估算,2025年全球服务器市场规模在4200亿美元到4500亿美元之间,其中流向公司的物料成本收入约为1900亿美元[5] - 基于公司技术的机器(由OEM/ODM销售)在2025年的收入可能在2750亿美元到3250亿美元之间,占整个系统市场份额的61%到77%[5] - 人工智能系统几乎所有的利润都流向了公司,其毛利润、营业利润和净利润数据明确体现了这一点[5] 2026年技术路线图细节 - 2026年路线图明确提及了“Oberon”和“Kyber”机架的演进[8] - “Vera”Arm服务器CPU拥有88个定制的“Olympus”核心,支持双线程,配备1.8 TB/秒的NVLink芯片间互连,用于连接“Rubin”R200 GPU加速器[9] - “Rubin”R200 GPU由两个芯片通过NVLink C2C连接,配备288 GB HBM4显存,其张量核心可提供50 petaflops的FP4性能[9] - “Blackwell”B200和B300 GPU配备288 GB HBM3E显存,FP4性能分别为10 petaflops和15 petaflops[9] - “Oberon”机架式服务器预计采用与Blackwell架构相同的NVL72系统,配备72个GPU插槽和36个CPU插槽[9] - “Groq LP30”将采用专用机架包装,配备标准的Spectrum以太网主干网[9] - “Oberon ETL256”配置意味着256个Vera CPU或256个Groq LPU可以连接到该背板[10] - 每个“Groq sled”有四个插槽,每个插槽装有八个LP30处理器[10] - 一组LP30处理器机架被称为“Groq 3 LPX”系统,包含32个滑橇,总计拥有315 petaflops的FP8推理计算能力,256个芯片上配备128 GB SRAM,总SRAM带宽为40 PB/秒,Spectrum ETL背板总扩展带宽为640 TB/秒[12] - “Vera ETL”机架可容纳32个机架单元,总计256个CPU,22,528个核心,512 TB主内存,以及300 TB/秒的内存带宽[13] 2027-2028年及未来技术展望 - 2027年计划推出“Rubin Ultra”GPU(暂定名R300),将插槽内GPU芯片数量从两颗增加到四颗,提供100 petaflops的FP4性能[16] - “Kyber”机架将GPU插槽数量翻倍至144个,采用铜质中板,为四颗Rubin GPU芯片配备16组HBM4E显存,总容量1TB,读写速度32TB/秒[16] - 2028年计划推出采用CPO(共封装光学)技术的NVLink 8端口[20] - 2028年的“Rosa-Feynman”系统将搭载“Groq LP40”计算引擎,并为其添加NVLink端口[19] - “Feynman”GPU预期将采用芯片堆叠技术和定制HBM内存[22] - 随着NVSwitch 8 CPO推出,在多层网络下,公司的GPU域大小预计将达到1152个GPU[21] 互连技术发展 - NVLink带宽持续翻倍:Rubin GPU的NVLink 6端口带宽为3,600 GB/秒,Rubin Ultra的NVLink 7端口带宽为7,200 GB/秒[18] - 2029年规划的NVLink 9 CPO带宽预计达到28,800 GB/秒[17] - 在Rubin系列中,Spectrum-6以太网ASIC将采用共封装光器件[19] - 公司可能在未来的Groq LPU中考虑采用晶圆级ASIC设计,以消除芯片间C2C互连的缓冲需求[17] 产品命名与系统架构 - 基于BlueField-4 DPU的存储机架被称为BlueField STX机架,基于Spectrum-6交换机的机架被称为Spectrum-5 SPX机架[15] - 基于Vera CPU的计算处理机架可能被命名为Vera CPX机架[15] - 这些系统都基于MGX模块化服务器架构[15]