Scale up 网络
搜索文档
超节点与Scaleup网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink3
东兴证券· 2026-02-05 10:28
报告行业投资评级 - 看好/维持 [2] 报告的核心观点 - 大语言模型参数规模向万亿级演进,驱动对超高带宽、超低延迟Scale up网络的需求,超节点成为AI算力网络重要的技术创新方向 [4][9] - 英伟达在超节点方案上处于领先优势,其优势建立在自研的NVLink和NVLink Switch技术上 [5][6] - 全球超节点竞争格局尚未确立,除传统芯片厂商外,更多云厂商、通信设备商等加入竞争,建议关注英伟达供应链及国内相关厂商 [9] 根据相关目录分别进行总结 1. LLM训练要求高带宽与延迟,驱动超节点成为AI算力网络创新方向 - 大语言模型参数规模从千亿级向万亿乃至十万亿级演进,跨服务器张量并行和混合专家模型中的专家并行成为必然,对网络带宽与延迟要求极为严苛 [4][18] - 为满足需求,构建超高带宽、超低延迟的Scale up网络成为业界主流技术路径 [4][18] - Scale up网络特点:算力规模为数十卡至千卡级、资源利用率80%以上、通信延迟百纳秒级、支持统一内存访问、但定制化程度高 [20][22] - 超节点主要由计算节点、交换节点和Scale-up网络互联构成,其互联方案直接影响系统关键指标,目前主流有铜缆和光纤两类方案 [23][26] 2. 英伟达:超节点领先优势建立在NVLink和NVLink Switch 2.1 Scale up网络核心技术:NVLink与NVLink交换机 - NVLink与NVLink交换机是英伟达构建单机柜Scale up网络的核心技术组合,二者协同演进 [33] - 截至2025年,NVLink 5 Switch支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向) [6][34] - 2026年发布的第六代NVLink交换机支持的GPU-to-GPU通信带宽提升至3.6TB/s,在VR NVL72系统中提供260TB/s聚合带宽 [33][34] - NVLink采用差分信号传输、SerDes模块、网状拓扑、流量调度信用机制、多Lane绑定、统一内存空间等一系列先进技术 [6][35] - NVSwitch作为专门交换芯片,采用多阶Clos网络架构,实现多GPU高速全互联,解决了点对点连接复杂度高的问题 [39] 2.2 GB200 NVL72超节点:铜缆互联,总交换容量129.6TB/s - GB200 NVL72将Scale-up规模稳定在72个GPU/机柜,形成可复制的标准化方案 [7][43] - 节点由18个计算托架和9个交换托架构成,通过“NVLink5私有协议+铜线缆”实现全连接 [7] - 提供180 PFLOPS的TF32 Tensor Core算力,总内存容量13.4TB,内存带宽576TB/s,Scale up带宽64800单向GB/s [47][48] - 单颗NVSwitch5芯片交换容量为7.2TB/s,18颗芯片总交换容量129.6TB/s [54] - 主要采用直连铜缆互联,共需约5184根铜缆,机柜功耗145KW [48][68] 2.3 VR200 NVL72超节点:延续GB200工程技艺,总交换容量翻倍 - 2026年发布的新一代VR200 NVL72属于连续性创新,计算节点仍为72 GPU与36 CPU [46][70] - 交换节点配置36颗第六代NVSwitch芯片,数量相比GB200 NVL72翻倍,单芯片交换容量保持7.2TB/s [72] - 总交换容量提升至259.2TB/s,相比GB200 NVL72翻倍 [75] - CPU-GPU互联带宽提升至1.8TB/s,相比上代900GB/s提升一倍 [75] - 延续铜缆互联方案,但用中板取代部分线缆,且因SerDes速率升级,单连接所需铜缆由4根减为2根 [81] 2.4 总结:处于领先优势,互联GPU数将从72颗进一步向576颗发展 - 英伟达已推出GH200 NVL72、GB200/GB300 NVL72、VR200 NVL72三代超节点,处于行业领先地位 [5][43] - 根据大摩预测,2025年英伟达GB200/300 NVL72出货量约2800台 [5] - 展望2026-2027年,计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数将从72颗向576颗发展 [5][85] - 未来将在Kyber机架中引入NVLink Switch Blade,通过PCB中板替代传统5000+根有源铜缆 [5][85] - 报告指出,AI产业在探索降低张量并行与专家并行规模的技术方案,这可能限制Scale up网络的发展空间及英伟达的领先优势,未来Scale up与Scale out网络融合或是发展趋势 [8][86] 3. 投资建议 - 自2025年开始,超节点成为AI算力网络重要的技术创新方向,竞争从芯片算力延伸至“芯片+Scale up网络” [9] - 全球参与厂商众多,包括英伟达、华为、AMD、谷歌、微软、Meta、Amazon及中国移动、阿里巴巴、腾讯、百度、中科曙光、中兴通讯、浪潮信息、紫光股份、沐曦股份、恒为科技等 [9] - 投资建议关注三个方向:1) 英伟达超节点供应链,包括PCB背板、高速铜缆、光模块、供电与液冷系统等;2) 发布国产超节点的国内云厂商、通信设备厂商与芯片厂商;3) 国内交换机供应商及交换机芯片研发商 [9][97]