NVIDIA GTC会议纪要:对科技供应链的影响 1 会议与行业概况 * 会议为NVIDIA第16届GTC,于2026年3月16日至19日在圣何塞举行,现场有30,000人参加,线上有300万人参加,共举办了1,000场会议和450多个展览[1] * 纪要涉及行业为AI技术供应链,包括硬件组装(ODM)、电源、散热、内存等关键环节[1] * 核心观点:对AI供应链持积极态度,但需关注中东冲突的潜在影响,相对更看好供应紧张且价格上涨的供应链组件和半导体,而非硬件品牌和ODM[14] 2 市场需求与供应状况 * 需求强劲,供应受限:NVIDIA披露2025-27年Blackwell和Rubin订单总额已达1万亿美元(去年秋季披露的2025-26年订单为5,000亿美元)[2] * 供应瓶颈仍是主要担忧:内存最为突出,其次是光模块、PCB/基板、先进晶圆[2] * 需求来源广泛:来自CSP和云新贵(Neoclouds)的需求强劲,支持NVL72机架假设从2026年的65k个增长至2027年的83k个(60k Rubin + 23k Blackwell)[2] * 企业、政府和二级云对HGX的需求也在增长,因为AI用例正在拓宽[2] * 地缘政治影响:美国-伊朗冲突引发了物料交付的采购担忧,ODM厂商指出中东项目/交付和来自以色列的网络支持出现了一些延迟[2] 3 硬件组装与标准化趋势 * 组装效率提升:从Blackwell到Rubin,计算托盘组装时间从2小时缩短至5分钟,机架组装和测试时间从去年的4-6周缩短至今年的2-3天至1周[3] * 标准化与商品化担忧:NVIDIA的MGX生态系统旨在通过标准化设计简化硬件组装、提升年度升级能力并建立有弹性的供应链,但引发了投资者对标准化等同于商品化的担忧[4] * ODM厂商差异化:尽管MGX规格标准化,但供应商在实现方式上仍有差异,以提升可靠性、成本效益、上市时间、可维护性和客户服务[4][6] * AMD Helios进度:对AMD Helios机架满足时间线的信心较低,因其采用新的双宽机架架构,可能推迟至2026年底或2027年[3] 4 电源系统演进与机遇 * Rubin带来内容增长:Rubin的电源单元(PSU)内容增长超过50%,支持台达电子(Delta)维持去年30%以上的年销售增长预期[7] * 中国竞争:中期风险来自中国竞争,如Megmeet已通过NVIDIA认证,并通过将生产转移至泰国成为美国客户的备用供应商,其电源机架将于4月开始送样[7] * 向电源侧柜演进:随着计算密度提升,Rubin Ultra将推动电源组件移至IT机架旁边的独立侧柜中[7] * 第一代电源侧柜:包含6个110kW电源柜,服务于500-600kW的IT机架,并集成5个90kW电池备份柜、配电单元和可选电容备份单元,实现每瓦更高内容价值[7] * 固态变压器(SST):预计在2028-2030年期间引入,将成为电源领域的新战场,取代传统变压器以及机架附近的UPS和AC-DC转换内容[8] * 800V DC转型:为应对未来高达1MW的机架功率,需从目前的50V升级至800V DC,以将电流降至更现实的水平[27] * 效率与成本节约:转向800V DC可将电源转换步骤从4步压缩至3步,效率从93%提升至95%,以1GW负载、0.08美元/千瓦时的电价计算,每年可节省1,590万美元[38][39] 5 散热架构发展 * 液冷全覆盖:从Blackwell的80%液冷/20%风冷混合模式,到Rubin实现100%液冷覆盖所有有源组件[9] * 散热架构演进:L2A侧柜(以台达电子市场份额领先)将延续至Rubin一代,直到2027年上半年;L2L CDU将随着更高功率的Rubin Ultra成为主流[9] * 散热能力提升:CoolIT计划在2026年第三季度将芯片热通量从300W/平方厘米提升至500W/平方厘米,在2026年第一季度将冷板从4kW+提升至15kW+,服务器散热从20kW+提升至50kW+,并在2027年将CDU从2MW+提升至10MW+[21] 6 内存:关键组件与短缺 * 内存重要性上升:智能体、推理和多模态推断增加了内存的重要性[10] * HBM4升级:从HBM3E升级到HBM4,容量从最高36GB提升至48GB(16层堆叠),带宽从1.2TB/秒+提升至2.8TB/秒+,功耗降低超过20%[81] * SK海力士模拟显示:带宽从7TB/秒翻倍至14TB/秒(升级至HBM4),可驱动令牌吞吐量比HBM3E提升1.4-1.6倍[96] * LPDDR用于KV缓存卸载:使用LPDDR卸载KV缓存可比DDR降低33%功耗,首次令牌时间加快2.3倍[82] * SSD需求:智能体AI需要运行更长的任务和复杂推理,上下文存储在KV缓存中,不再适合GPU内存,可转移至NVIDIA上下文内存存储平台(CMX),即跨多个GPU共享的闪存[91] * 供应紧张:美光表示目前仅能满足市场所见需求的约60%[83] 7 下一代机架设计 * Rubin Ultra/Kyber架构调整:从去年的4个罐体和中间层PCB压缩为2个,每个包含4个机柜,每个机柜有18个计算刀片,使每个机柜的GPU从288个减少至144个[13] * 功率密度提升:电源和散热供应商正推动从Rubin的227kW升级至更易管理的2-3倍功率,即500-600kW[13] * 光学互连增长:UBS认为,随着2028年机架间通信的增加,光学器件将得到发展,机架内部连接仍将使用铜缆[13] * 连接器变化:Kyber将引入由FIT、TE Connectivity、Amphenol和立讯精密提供的中间层连接器模块,取代Blackwell和Rubin使用的盒式电缆[13] 8 其他组件与系统 * CPU需求回升:用于编排AI和处理智能体执行的传统计算任务,CPU需求正在回升,并整合了老旧低效的服务器[12] * LPU的补充作用:Groq LPU是对Vera Rubin GPU的补充而非取代,建议GPU与LPU的混合比例为1:2[11] * LPU服务器潜在收入:基于GTC反馈,LPU服务器的机架合作伙伴可能是鸿海和纬创,以10-15%的收入占比计算,可能带来500亿美元的增量硬件收入,营业利润率约为2-3%[11] 9 供应链公司观点与前景 * 看好的领域:先进制程代工(台积电)、先进封装(日月光、京元电子、鸿准)、GPU/ASIC(联发科、智原、信骅)、内存(三星、SK海力士、美光)、数据中心电源升级(台达电子)、PCB/基板(欣兴电子、深南电路、生益科技)[14] * 硬件厂商表现:硬件领域仍看好,尽管表现可能落后于半导体,但鸿海、广达、纬创、纬颖仍有盈利增长和具支撑力的市盈率[14]
英伟达 GTC 大会落幕:对科技供应链的启示-NVIDIA‘s GTC conclusion_ Implications for the Tech Supply Chain