Workflow
电子行业2026年度策略深度系列一:超节点:大模型的“光刻机”,国产算力突围的革命性机会
东北证券·2025-11-14 16:50

核心观点 - GPU不再是算力竞逐的核心,超节点规模将是算力世界的决胜场[1] 超节点通过Scale-up架构实现远超Scale-out的卡间互联带宽,是大模型训练最理想的工具[1] 全球主流厂商已密集布局超节点产品,未来算力采购将以超节点为单位,而非GPU卡[1][34] - 超节点是中国算力突围的革命性机会,其重要性堪比大模型的“光刻机”[4] 国产算力可通过超节点架构,以更多卡数和更高能耗实现与海外同等算力,即“以规模换性能,以能源换性能”[3] - 超节点时代将带来显著投资机会,包括先进制程需求倍增、Scale-up交换芯片需求激增、以及电源与液冷等能耗相关环节的陡峭增长[1][2][3] 超节点架构趋势与产业演进 - 大模型参数规模指数级增长,对算力、内存与通信带宽需求攀升,分布式训练成为必然选择,但传统Scale-out架构存在通信绕行导致延迟高、带宽受限及算力利用率显著下滑等结构性瓶颈[16][20][22] - 超节点Scale-up架构通过NVLink、CXL等高速互联协议将加速器紧密耦合,构建高带宽(TB/s级)、低延迟(纳秒级)的直接通信域,突破“通信墙”、“功耗墙”与“软件墙”三大核心瓶颈[23][26] - 全球主流算力玩家已明确超节点产业演进路径:英伟达展出72卡、144卡、576卡方案;华为亮相384卡、8192卡、15488卡方案;阿里与中科曙光等也推出相应产品[1][34] 超节点互联协议呈现从私有封闭标准向下游客户主导的开放标准转移的趋势[55][58] 超节点对先进制程的倍增需求 - 超节点架构下,同等GPU数量集群将消耗数十倍数量的Scale-up switch芯片,其芯片数量与集群GPU数量比相近甚至超过,且Switch芯片采用与GPU同等先进制程工艺,将带动先进制程需求翻倍增长[1][59] - 以华为Atlas 950超节点(8192卡)为例,其使用9000+颗LRS与500+颗HRS交换芯片,Scale-up交换机价值量占整个超节点价值量超过6%[2] 相比传统Spine-Leaf架构,超节点架构交换机用量增长约36倍(LRS)至40.5倍(HRS)[59][63] - 在1000套8192卡集群情景下,NPU对先进制程产能需求约2.63万片/月,而LRS与HRS两类交换芯片合计消耗约1.46万片/月,接近NPU产能需求的60%[59][68][69] 交换芯片在先进制程产能结构中的权重正显著提升[65] 国产算力的规模换算力路径 - 受工艺制程限制,国产芯片单卡算力长期落后于海外,昇腾910C的FP16算力(800 TFLOPS)仅为英伟达H100(1979 TFLOPS)的约40%[76] 超节点架构打破了集群规模限制,使国产算力可通过堆叠更多卡数在集群有效算力上逼近海外水平[3][33] - 对标结果显示,在同等算力条件下,2025年国产超节点所需卡数规模是海外超节点的3.2倍,系统功耗约为2.3倍;到2027年,该卡数比值将提升至8.5倍,功耗比值提升至5.8倍[3][77][78][80] 国产超节点各环节中,与“量”相关的GPU、交换芯片、先进制程等将呈现更高增长潜能;与“能源”相关的电源、液冷等将有更陡峭增长斜率[3] - 国内超节点未来几年将以“柜内全铜、柜间全光”连接方案为主流,在EUV光刻机突破前可能持续该方案,因此在连接环节上“国内看铜,海外看光&PCB”[4] 超节点市场空间与投资机会 - 国内AI资本开支进入加速通道,预计C5(阿里巴巴、字节跳动、腾讯、美团、百度)AI CAPEX将从2024年的1688亿元人民币增长至2030年的19222亿元人民币,年复合增长率达50%[91][94][96] 超节点作为高密度算力核心设施,其采购占比预计从2025年的10%提升至2030年的80%,对应市场规模从253亿元增至1.54万亿元[103][104] - 以年出货1000套华为Atlas 950超节点测算,各环节市场空间分别为:先进制程晶圆代工388亿元、封装624亿元、HBM 793亿元、Scale-up交换芯片549亿元、高速铜缆模组656亿元、光模块492亿元、电源246亿元、液冷697亿元、PCB 246亿元[105][106] - 报告建议重点关注高景气与高弹性方向:先进制程(国内晶圆厂)、交换机&交换芯片(盛科通信、中兴通讯等)、高速铜缆模组(华丰科技、立讯精密等)、光模块(新易盛、中际旭创等)、液冷(英维克、申菱环境等)以及PCB/CCL(深南电路、生益科技等)[107][108][109]