Workflow
NVLink Switch
icon
搜索文档
东兴证券:全球超节点竞争格局尚未确立 建议关注发布国产超节点云厂商等
智通财经网· 2026-02-05 14:20
文章核心观点 - 自2025年开始,超节点成为AI算力网络重要的技术创新方向,AI芯片厂商的竞争从芯片算力性能延伸至芯片与Scale up网络的双战场 [1] - 全球超节点竞争格局尚未确立,英伟达目前处于领先地位,但越来越多厂商加入竞争 [1][5] - 基于交换机及芯片是Scale up网络互联的关键设备,建议关注国内交换机供应商以及交换机芯片研发商 [1][6] 英伟达超节点技术演进与方案 - **Hopper架构开启初步探索**:GH200通过NVLink和NVLink-C2C技术,实现GPU与CPU内存统一编址 [1] - **Blackwell架构推动标准化**:GB200 NVL72将Scale-up规模稳定在72个GPU/机柜,形成可复制标准化方案,由18个Compute Tray和9个Switch Tray构成,通过NVLink5私有协议与铜线缆实现满带宽全连接 [2] - **Rubin架构实现带宽倍增**:VR200 NVL72的NVLink 6 Switch将单GPU互连带宽提升至3.6 TB/s(上代为1.8TB/s),Spectrum-6交换机支持CPO技术,集成32个1.6Tb/s硅光光学引擎 [2] - **未来规划持续扩展**:2026-2027年计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数将从72颗向576颗发展,并在Kyber机架架构中引入NVLink Switch Blade替代传统5000+根有源铜缆 [3] 英伟达的市场地位与优势 - **推出成熟方案并领先**:2024-2025年陆续推出GH200 NVL72、GB200/GB300 NVL72等成熟超节点解决方案 [3] - **出货量预测**:根据大摩预测,2025年英伟达GB200/300 NVL72出货量约2800台 [3] - **技术优势基础**:优势建立在NVLink和NVLink Switch上,NVLink 5 Switch支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向) [4] - **面临潜在挑战**:Scale up网络的发展空间可能受降低TP与EP规模的技术方案影响,为保持领先,实现Scale up网络和Scale out网络融合或成为新的发展趋势 [4] 超节点领域的竞争格局与参与者 - **竞争延伸至双战场**:AI芯片厂商竞争从芯片算力性能延续至芯片+Scale up网络 [1][5] - **参与者广泛增加**:除英伟达、华为、AMD、谷歌外,更多厂商加入竞争,包括微软、Meta、Amazon、中国移动、阿里巴巴、腾讯、百度、中科曙光、中兴通讯、浪潮信息、紫光股份(新华三)、沐曦股份、恒为科技等 [5] - **格局未定与国内机会**:全球竞争格局尚未确立,中国厂商参与度高,或有国内厂商在超节点领域取得领先优势 [6] 投资关注方向 - **关注英伟达供应链**:包括PCB背板、高速铜缆、光模块、供电与液冷系统等 [6] - **关注国内领先厂商**:建议关注发布国产超节点的云厂商、通信设备厂商与芯片厂商 [6] - **关注关键网络设备**:基于交换机及芯片是Scale up网络互联的关键设备,建议关注国内交换机供应商以及交换机芯片研发商 [1][6]
超节点与Scaleup网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink3
东兴证券· 2026-02-05 10:28
报告行业投资评级 - 看好/维持 [2] 报告的核心观点 - 大语言模型参数规模向万亿级演进,驱动对超高带宽、超低延迟Scale up网络的需求,超节点成为AI算力网络重要的技术创新方向 [4][9] - 英伟达在超节点方案上处于领先优势,其优势建立在自研的NVLink和NVLink Switch技术上 [5][6] - 全球超节点竞争格局尚未确立,除传统芯片厂商外,更多云厂商、通信设备商等加入竞争,建议关注英伟达供应链及国内相关厂商 [9] 根据相关目录分别进行总结 1. LLM训练要求高带宽与延迟,驱动超节点成为AI算力网络创新方向 - 大语言模型参数规模从千亿级向万亿乃至十万亿级演进,跨服务器张量并行和混合专家模型中的专家并行成为必然,对网络带宽与延迟要求极为严苛 [4][18] - 为满足需求,构建超高带宽、超低延迟的Scale up网络成为业界主流技术路径 [4][18] - Scale up网络特点:算力规模为数十卡至千卡级、资源利用率80%以上、通信延迟百纳秒级、支持统一内存访问、但定制化程度高 [20][22] - 超节点主要由计算节点、交换节点和Scale-up网络互联构成,其互联方案直接影响系统关键指标,目前主流有铜缆和光纤两类方案 [23][26] 2. 英伟达:超节点领先优势建立在NVLink和NVLink Switch 2.1 Scale up网络核心技术:NVLink与NVLink交换机 - NVLink与NVLink交换机是英伟达构建单机柜Scale up网络的核心技术组合,二者协同演进 [33] - 截至2025年,NVLink 5 Switch支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向) [6][34] - 2026年发布的第六代NVLink交换机支持的GPU-to-GPU通信带宽提升至3.6TB/s,在VR NVL72系统中提供260TB/s聚合带宽 [33][34] - NVLink采用差分信号传输、SerDes模块、网状拓扑、流量调度信用机制、多Lane绑定、统一内存空间等一系列先进技术 [6][35] - NVSwitch作为专门交换芯片,采用多阶Clos网络架构,实现多GPU高速全互联,解决了点对点连接复杂度高的问题 [39] 2.2 GB200 NVL72超节点:铜缆互联,总交换容量129.6TB/s - GB200 NVL72将Scale-up规模稳定在72个GPU/机柜,形成可复制的标准化方案 [7][43] - 节点由18个计算托架和9个交换托架构成,通过“NVLink5私有协议+铜线缆”实现全连接 [7] - 提供180 PFLOPS的TF32 Tensor Core算力,总内存容量13.4TB,内存带宽576TB/s,Scale up带宽64800单向GB/s [47][48] - 单颗NVSwitch5芯片交换容量为7.2TB/s,18颗芯片总交换容量129.6TB/s [54] - 主要采用直连铜缆互联,共需约5184根铜缆,机柜功耗145KW [48][68] 2.3 VR200 NVL72超节点:延续GB200工程技艺,总交换容量翻倍 - 2026年发布的新一代VR200 NVL72属于连续性创新,计算节点仍为72 GPU与36 CPU [46][70] - 交换节点配置36颗第六代NVSwitch芯片,数量相比GB200 NVL72翻倍,单芯片交换容量保持7.2TB/s [72] - 总交换容量提升至259.2TB/s,相比GB200 NVL72翻倍 [75] - CPU-GPU互联带宽提升至1.8TB/s,相比上代900GB/s提升一倍 [75] - 延续铜缆互联方案,但用中板取代部分线缆,且因SerDes速率升级,单连接所需铜缆由4根减为2根 [81] 2.4 总结:处于领先优势,互联GPU数将从72颗进一步向576颗发展 - 英伟达已推出GH200 NVL72、GB200/GB300 NVL72、VR200 NVL72三代超节点,处于行业领先地位 [5][43] - 根据大摩预测,2025年英伟达GB200/300 NVL72出货量约2800台 [5] - 展望2026-2027年,计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数将从72颗向576颗发展 [5][85] - 未来将在Kyber机架中引入NVLink Switch Blade,通过PCB中板替代传统5000+根有源铜缆 [5][85] - 报告指出,AI产业在探索降低张量并行与专家并行规模的技术方案,这可能限制Scale up网络的发展空间及英伟达的领先优势,未来Scale up与Scale out网络融合或是发展趋势 [8][86] 3. 投资建议 - 自2025年开始,超节点成为AI算力网络重要的技术创新方向,竞争从芯片算力延伸至“芯片+Scale up网络” [9] - 全球参与厂商众多,包括英伟达、华为、AMD、谷歌、微软、Meta、Amazon及中国移动、阿里巴巴、腾讯、百度、中科曙光、中兴通讯、浪潮信息、紫光股份、沐曦股份、恒为科技等 [9] - 投资建议关注三个方向:1) 英伟达超节点供应链,包括PCB背板、高速铜缆、光模块、供电与液冷系统等;2) 发布国产超节点的国内云厂商、通信设备厂商与芯片厂商;3) 国内交换机供应商及交换机芯片研发商 [9][97]