行业投资评级 - 通信行业评级为“超配”,前次评级亦为“超配”,本次评级维持不变 [5] 报告核心观点 - 大模型参数提升催生Scale-up网络需求,通过高速互联多张GPU形成统一巨型计算单元以满足大模型训练和推理的算力与内存需求,据Lightcounting,Scale-up交换机市场2025年规模近60亿美元,2025-2030年CAGR预计为26% [1] - Scale-up网络关键在于带宽提升和时延降低,内存访问时延需低于100ns,推动英伟达NVLink、谷歌ICI、亚马逊NeuronLink、华为UB等自研通信方案及光/铜互联、OCS光交换机等技术增量需求 [2] - Scale-up网络需求增长驱动三大受益方向:高端交换芯片与接口芯片需求提升、超节点一体化交付增加通信硬件产业链附加值、光互联与铜互联市场扩大 [3] 基于目录的详细总结 一、Scale-up超节点:突破单卡计算瓶颈 - 大模型参数规模提升(如MoE架构)要求更大算力集群,张量并行(TP)与专家并行(EP)等技术带来跨节点通信需求,带宽需数百至数千GB/s且时延极低 [13][17] - 超节点由计算节点、高速互联网络(交换节点与光/铜互联)及辅助保障模块构成,Scale-up网络通过定制协议(如NVLink)提供超1TB/s带宽,支持GPU内存互访(时延<100ns) [18][21][22][25] - 超节点形态从整机柜扩展至分机柜与级联超节点,光连接需求随规模扩大而增长,级联超节点连接距离可达百米级 [26][27] 二、主流超节点系统概况 - 英伟达GB200 NVL72通过NVLink 5.0实现单GPU总带宽1.8TB/s,采用铜缆直连降低时延,整柜交换带宽达130TB/s [21][31][33] - 谷歌第七代TPU Ironwood通过ICI网络支持9216芯片集群,峰值性能4614TFLOPS(TPU v5p的10倍),引入OCS光交换机提升吞吐量30%、降能耗40% [35][36][40][42] - 亚马逊Trainium2服务器通过NeuronLink网络互联64芯片,单向带宽640GB/s,机柜内采用无源铜缆(DAC)连接 [45][48] - 华为CloudMatrix384采用光互联与UB协议,跨16机柜实现300 PFLOPS算力(GB200 NVL72的1.7倍),使用6912个400G LPO光模块 [49][52] 三、Scale-up网络受益方向 - 超节点软硬件深度耦合,硬件厂商通过整机柜交付提升附加值,如中兴通讯具备全栈能力(自研交换芯片、DPU、CPU),锐捷网络推出51.2T CPO交换机并服务头部互联网厂商 [56][57][59] - 以太网等开放协议(如ESUN工作组)渗透Scale-up网络,第三方交换芯片厂商迎增量机遇,盛科通信高端芯片(12.8T/25.6Tbps)达国际先进水平 [61][65][67][71] - 铜互联(AEC/ACC)因低成本、高稳定性需求旺盛,2029年全球高速铜缆市场预计达67亿美元;光互联(AOC/LPO/硅光)快速渗透,CPO市场2030年有望达81亿美元(2024-2030年CAGR 137%),OCS交换机市场2031年预计20亿美元(2025-2031年CAGR 17.1%) [73][77][78][81][82] - 产业链公司如德科立(OCS样品获千万订单)、腾景科技(光器件覆盖OCS/CPO)、瑞可达(铜缆连接器)直接受益 [84][85][89] 四、投资建议 - 超节点一体化交付提升通信硬件附加值,高端交换芯片与接口芯片需求增长,以太网开放协议带来增量机会 [92] - 光互联与铜互联并行发展,CPO、OCS等技术推动光通信渗透率提升,Scale-up网络贡献光模块市场增量 [93]
通信行业专题报告:超节点架构兴起,Scale-up开启网络互联第二增长曲线
西部证券·2025-11-14 19:35