核心观点 - 大模型训练和推理带动AI算力需求增长 GB300和Vera Rubin等新一代算力架构将推出 算力产业链多个环节持续受益[1] GPU核心升级 - GB300基于Blackwell Ultra架构 采用TSMC 4NP工艺与CoWoS-L封装 FP4浮点算力达15PFLOPS 是B200的1.5倍[1] - GB300搭载288GB HBM3E显存 Vera Rubin NVL144性能是GB300 NVL72的3.3倍[1] - Rubin Ultra NVL576性能较GB300 NVL72提升14倍 内存是GB300的8倍[1] - 英伟达FY2026Q2营收467亿美元 同比增长56%[1] 服务器架构演进 - GB300 NVL72系统由18个计算托盘和9个交换机托盘组成 搭载72颗Blackwell Ultra GPU与36颗Grace CPU[1] - 与Hopper相比 GB300 NVL72的AI工厂总体产出性能最多提升50倍[1] - GB300 NVL72集成ConnectX-8网卡与BlueField-3 DPU[1] - Rubin Ultra NVL576将于2027年推出 采用Kyber架构 大幅提升机架密度[1] 网络技术突破 - CPO将硅光子器件与ASIC封装 取代传统可插拔光模块 能效提升3.5倍 部署速度提升1.3倍[2] - Quantum-X和Spectrum-X交换机提供高达400Tbps吞吐量 减少对传统光收发器依赖[2] - Rubin采用NVLink 6.0技术 速度翻倍至3.6TB/s[2] - NVLink Fusion向第三方开放互联生态 支持异构芯片协同[2] - NVSwitch 7.0扩展至576颗GPU互联 实现非阻塞通信[2] HBM发展进程 - SK海力士2025年3月率先交付全球首款12层堆叠HBM4样品[2] - 三星计划2025年7月底前向AMD和英伟达提供HBM4样品[2] - 美光展示HBM4计划 预计2026年实现量产[2] - SK海力士与NVIDIA、微软及博通合作设计定制化HBM芯片[2] 散热技术方案 - GB300采用独立液冷板设计 每个芯片配备单独一进一出液冷板[2] - 液冷技术具备更高散热效率 包括冷板式与浸没式两类[2] - 冷板式为间接冷却 初始投资中等 运维成本较低 技术相对成熟[2] - 英伟达GB300 NVL72采用全液冷设计方案[2]
国海证券:大模型训推带动AI算力需求增长 计算、网络、存储持续升级