聚焦Rubin落地、Feynman前瞻与基础设施重构：英伟达GTC前瞻与基础设施重构

报告行业投资评级 - 行业投资评级：增持 [1] 报告核心观点 - 本次GTC 2026的核心看点不在于单一芯片参数刷新，而在于英伟达能否通过Rubin平台量产落地、Feynman架构前瞻以及光互联、供电与液冷一体化升级，推动AI产业从“购买GPU”迈向“部署AI工厂”的新阶段 [3] - 2026年GTC最值得关注的并非某颗芯片的参数刷新，而是英伟达是否会通过Rubin的系统化落地、Feynman的路线图释放，以及光互联、供电和液冷一体化升级，正式把行业推进到“部署AI工厂”的新阶段 [6][28] 根据目录总结 1. Rubin平台的量产兑现与系统化落地 - Rubin平台已不再只是单颗GPU产品，而是由CPU、GPU、互联、网络和系统组件共同构成的集成式AI超算平台，其核心目标是通过系统级整合降低token成本，并压缩大规模MoE训练和推理所需的GPU占用规模 [6][10] - 英伟达正在把AI基础设施的交付单位从板卡提升到整柜系统，市场关注点正从单卡参数转向机柜级和机架级形态，如NVL72、NVL144和NVL576等rack-scale配置 [6][11] - 随着Vera Rubin平台在CES 2026上确认进入量产阶段，本次GTC很可能揭晓其强化版——Rubin Ultra，一个Rubin Ultra机柜将集成144颗GPU，构建高达1.5PB/s的Scale-up网络，单颗芯片双向互联带宽达到10.8TB/s [6][15] - 为实现高密度互联，Rubin或将采用双层网络拓扑结构，并在机柜内部实现“光进铜退” [6][16] - Rubin平台开始推动推理基础设施从统一GPU池走向更细分的分层优化，例如Rubin CPX被定义为面向massive-context inference的GPU类别，Vera Rubin NVL144 CPX单机柜可实现约8 exaflops AI性能、100TB fast memory以及1.7PB/s带宽 [18] 2. Feynman架构的前瞻披露与后Rubin时代的推理路线 - Feynman架构的前瞻披露预计将构成大会最具战略意义的看点，其价值在于向市场说明英伟达如何理解后Rubin时代的AI计算需求 [6][19] - Feynman可能成为首批采用台积电A16工艺的芯片，并首次集成Groq的LPU硬件栈，其生产预计在2028年启动，客户出货可能落在2029至2030年 [6][20] - Feynman可能引入以SRAM为核心的广泛集成或3D堆叠技术，单芯片功耗预计将突破5000W [6][20] - 英伟达可能会展示一款整合了Groq“语言处理单元”技术的新推理芯片，旨在满足市场对高效能、低成本推理方案的需求，Groq LPU路径更适合实时语音、交互式Agent等对响应时间高度敏感的场景 [6][21][23] 3. 光互联、供电与液冷共同驱动的数据中心基础设施重构 - 在互联层面，CPO与硅光正成为超大规模AI系统的重要方向，未来数据中心内部将逐步从传统铜互联走向更高带宽密度、更低损耗的光连接体系 [6][25] - 本届GTC被视为CPO商业化落地的关键里程碑，Rubin Ultra被普遍视为“光入柜内”的关键节点，光互联将进入机柜内部和scale-up路径 [25] - 在供电层面，Rubin单芯片功耗将超过2000W，Feynman目标功耗将超过5000W，800V高压直流供电被视为未来主电源的重要发展方向 [6][26] - 在散热层面，风冷正失去对超高功耗算力平台的适应性，液冷将从可选方案转向标准配置，并带动冷板、热界面材料和机柜级液冷系统同步升级 [6][27] - 液冷技术迭代重点指向散热材料和热界面材料升级，例如冷板从传统铜材升级到铜合金甚至金刚石相关材料，热界面材料方面液态金属和金刚石散热片是重要方向 [27]