Workflow
数据中心基础设施重构
icon
搜索文档
国泰海通|计算机:英伟达GTC前瞻:聚焦Rubin落地、Feynman前瞻与基础设施重构
文章核心观点 - 本次GTC 2026的核心看点不在于单一芯片参数,而在于英伟达能否通过Rubin平台量产、Feynman架构前瞻以及光互联、供电与液冷一体化升级,推动AI产业从“购买GPU”迈向“部署AI工厂”的新阶段 [1][4] Rubin平台的量产兑现与系统化落地 - Rubin已从单颗GPU产品演变为由CPU、GPU、互联、网络和系统组件构成的集成式AI超算平台,公司正在将AI基础设施的交付单位从板卡提升到整柜系统 [2] - Vera Rubin平台已确认进入量产阶段,本次GTC可能揭晓其强化版Rubin Ultra,一个Rubin Ultra机柜将集成144颗GPU,构建高达1.5PB/s的Scale-up网络 [2] - Rubin平台单颗芯片双向互联带宽达到10.8TB/s,为实现高密度互联,可能采用双层网络拓扑结构,并在机柜内部实现“光进铜退” [2] Feynman架构的前瞻披露 - Feynman架构的披露预计是大会最具战略意义的看点,该架构可能成为首批采用台积电A16工艺的芯片,并首次集成Groq的LPU硬件栈 [3] - Feynman的生产预计在2028年启动,客户出货可能落在2029至2030年,该架构可能引入以SRAM为核心的广泛集成或3D堆叠技术,单芯片功耗预计将突破5000W [3] - Feynman的价值在于向市场阐明公司对后Rubin时代AI计算需求的理解,本次可能以路线图或架构预告方式出现 [3] - 公司可能展示一款整合了Groq“语言处理单元”技术的全新推理芯片,标志着公司正积极布局推理计算领域,旨在满足市场对高效能、低成本计算方案的需求 [3] 光互联、供电与液冷驱动的数据中心基础设施重构 - 在互联层面,CPO与硅光正成为超大规模AI系统的重要方向,数据中心内部将逐步从传统铜互联走向更高带宽密度、更低损耗的光连接体系 [4] - 在供电层面,800V HVDC、高集成模块化供电和垂直供电等方案,反映出未来限制AI系统扩容的关键因素已不仅是芯片制造能力,更是电力能否高效稳定地送达每一个算力节点 [4] - 在散热层面,风冷正失去对超高功耗算力平台的适应性,液冷将越来越从可选方案转向标准配置,并带动冷板、热界面材料和机柜级液冷系统同步升级 [4] 行业影响与展望 - 2026年GTC最值得关注的并非某一颗芯片的参数刷新,而是公司是否会通过Rubin的系统化落地、Feynman的路线图释放以及光互联、供电和液冷一体化升级,正式把行业从“购买GPU”推进到“部署AI工厂”的新阶段 [4]