Workflow
AI算力跟踪深度(三):从英伟达的视角看算力互连板块成长性:ScaleUp网络的“ScalingLaw”存在吗?

行业投资评级 - 报告未明确给出行业投资评级 [1][2][3][4][5][6][7][8][9][11][13][14][15][16][17][18][19][20][21][22][23][25][27][28][29][30][31][32][33][34][35][36][37][38][39][40][41][43][44][45][46][47][48][51][52][53][54][55][56][57][58][59][60][61][62][63][64][65][67][68][69][70][71][73][74][75][78][79][80][82][85][86][88][90][91][92][93][94][95][96][97][98][99][100][101][103][104][105][106][107][108][109][110][111] 核心观点 - Scale Up网络存在Scaling Law,柜间第二层网络将逐渐出现,光连接与AEC连接需求为芯片的9倍,交换机需求为芯片的4倍,较Scale Out网络倍增 [3] - 英伟达通过提升单卡带宽(NVLink 5.0达7200Gb/s)和扩大超节点规模(从H100 NVL8到GB200 NVL72等)持续扩大Scale Up网络 [3][16][19] - "内存墙"问题(模型内存墙与算力内存墙逐代放大)和AI计算范式演进(张量并行与专家并行)推动Scale Up网络升级 [4][34][35][39][48] - 更大Scale Up网络可提升单卡有效性能、优化TCO,并支持用户体验提升(单用户TPS增长)及模型能力拓展(多模态应用) [6][53][57][60][64][68][73] - 组建更大Scale Up网络需在柜间搭建第二层交换机,光连接与AEC并存,单颗GPU需额外9个等效1.6T连接,每4颗GPU需额外1台交换机 [7][80][85][93] - 算力互连需求存在乘数效应:资本开支结构优化使芯片增速高于Capex增速,单芯片带宽提升使互连需求增速高于芯片需求增速 [9][11][103] 英伟达Scale Up规模扩展 - NVLink带宽持续迭代:NVLink 5.0单卡带宽达7200Gb/s,较NVLink 4.0(3600Gb/s)翻倍 [3][16][19] - 超节点规模从H100 NVL8(8卡)扩展到GH200 NVL256(256卡)、GB200 NVL72(72卡),并计划进一步扩大至NVL576等 [3][19][20][22][23][27][62] - 机柜方案(如NVL72)并非Scale Up上限,后续将作为最小节点在柜间拼接更大超节点,需光连接支持 [3][23][27][58][60] Scale Up网络需求驱动因素 - "内存墙"问题:模型参数与单卡显存差距、单卡算力与显存差距逐代放大,需通过Scale Up显存池化缓解 [4][34][35] - AI计算范式:张量并行(AllReduce通信,单次迭代单卡通信量达百GB级)和专家并行对通信频次及容量要求极高,需高速互联网络支持 [39][46][48][51][97][98] - 单用户TPS增长:主流模型单用户TPS超200 Tokens/s,用户体验提升及多模态应用(如AI图像生成耗数千Tokens)推动更大Scale Up需求 [6][53][65][68][70][73] Scale Up网络组建方式 - 网络架构:柜间搭建第二层Scale Up交换机(如NVL36×2方案),第一层Switch Tray需扩展以支持上行带宽 [7][80][82][85] - 连接方式:光连接(满足所有跨柜距离)与AEC(有效距离3米)并存,无源铜(DAC)仅支持1米距离 [7][86][88][90] - 硬件需求:单颗GPU需9个等效1.6T连接(为Scale Out的3-4.5倍),每4颗GPU需1台交换机(为Scale Out的7.5-12倍) [7][93][94] 投资建议 - Scale Up需求拓展带来光连接、AEC、交换机环节倍增需求 [7][105] - 光互连相关标的:中际旭创、新易盛、天孚通信、光库科技、长芯博创、仕佳光子、源杰科技、长光华芯、太辰光 [7][105] - 铜互连相关标的:中际旭创、兆龙互连 [7][105] - 交换机相关标的:锐捷网络、盛科通信、Astera Labs、博通、天弘科技、Arista [7][105]