超节点与Scale up网络
搜索文档
超节点与Scale up网络行业报告:谷歌、AMD、国产超节点持续发力,打破英伟达独大格局
搜狐财经· 2026-03-06 09:55
文章核心观点 超节点与Scale-up网络是支撑万亿级大模型与高实时性应用的关键基础设施,正处于快速发展期,并将成为算力芯片、网络部件、存储部件、供电散热等新兴技术的重要应用市场[2]。英伟达、谷歌、AMD和华为四家头部AI算力芯片厂商在该领域各有布局,行业格局正从英伟达一家独大向多元化竞争演变[2]。 根据相关目录分别进行总结 1. 超节点与Scale-up网络概述 - 大语言模型参数规模向万亿级演进,驱动对高带宽、低延迟网络的需求,构建Scale-up网络(纵向扩张网络)成为主流技术路径[23] - Scale-up网络旨在在一定成本和技术约束下实现超高带宽互联,其特点包括:算力规模为数十卡至千卡级、资源利用率80%以上、通信延迟为百纳秒级、支持统一内存访问,但定制化程度高[26][27][28] - 超节点主要由计算节点、交换节点和Scale-up网络互联构成,其互联方案(铜缆或光纤)直接影响系统的功耗、成本、规模和可靠性[29] - 目前主流互联方案分为两类:铜缆互联(如英伟达方案)具有功耗低、成本低、可靠性高的优势,但受距离限制,单个节点规模较小(如最大支持72张XPU卡);光纤互联(如华为方案)突破距离限制,节点规模更大(如支持384张XPU卡),但存在光模块功耗大、成本高、故障率高的短板[32] 2. 英伟达:领先优势建立在NVLink和NVLink Switch - 英伟达在超节点技术方案上处于领先地位,2024-2025年陆续推出GH200 NVL72、GB200/GB300 NVL72等成熟解决方案,预计2025年GB200/300 NVL72出货量约2800台[4] - 展望2026-2027年,英伟达计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数量将从72颗向576颗发展,并计划发布引入NVLink Switch Blade的新一代Kyber机架[4] - 英伟达超节点的核心优势在于NVLink和NVLink Switch技术,NVLink 5 Switch支持单GPU到GPU带宽1800GB/s,可构建72 GPU的NVLink域,总带宽达130 TB/s(双向)[5] - 后续NVSwitch Gen6和Gen7的GPU-to-GPU通信带宽将继续升级至3.6TB/s[5] - 然而,Scale-up网络的发展空间可能受限于AI产业探索降低张量并行与专家并行规模的技术方案,这或将限制英伟达的领先优势,未来实现Scale-up网络和Scale-out网络融合可能成为其新趋势[5] 3. 华为:对外开放灵衢互联协议,性能追赶英伟达 - 华为推出自研的灵衢互联协议,并从2.0版本起转向开放标准,但该协议尚未被国内业界广泛接受[6] - 国内Scale-up协议尚未统一,除华为灵衢外,还有中移OISA、腾讯ETH-X、高通量以太网ETH+以及中兴通讯OLink等多种互联协议在探索中,工信部正牵头推动CLink协议旨在形成统一国内标准[6] - 华为通过集群化方式实现性能追赶,其Atlas 950超节点预计2026年第四季度发布,总算力达到8 EFLOPS(FP8),超过同期英伟达NVL144的2.52 EFLOPS(FP8)[6] - Atlas 950超节点在内存容量(1152TB)与互联带宽(16.3PB/s)上也实现大幅领先[7] - 华为超节点技术仍在标准化阶段,Atlas 950放弃了全光互联架构,采用“柜内正交铜互联+柜间光互联”的混合设计,以平衡可靠性、成本、功耗和可扩展性[7] 4. 谷歌:建立光互联超节点,形成不对称竞争 - 谷歌TPU超节点建立了成熟的光互联Scale-up网络,技术路线独树一帜,其核心是光电路交换机[8] - 谷歌是全球首个将光电路交换机大规模商用部署于Scale-up网络的企业,该技术涉及精密光学、机械工程与半导体工艺的深度交叉,构筑了高技术壁垒[8] - 光电路交换技术具备优势:可跨多代光收发模块技术复用、每比特能耗较电分组交换机低数个数量级、引入的时延极小[9] - 2023-2025年谷歌陆续推出TPU v4、v5p、v7三代超节点,完成了技术路线探索和标准化,TPU v7已获得外部企业认可,例如Anthropic将在2026年直接从博通采购近100万颗TPU v7 Ironwood AI芯片[8] - 2027年,谷歌将推出第8代TPU,对标英伟达Vera Rubin,届时其超节点性能指标将进一步优化提升[8] 5. AMD:UALink成为重要开放标准,是有力竞品 - AMD作为Scale-up网络开放技术路线方,其主导的UALink成为重要开放标准,2025年1.0版本规范正式发布,2026年有望发布2.0版本[10] - UALink联盟受到业内广泛支持,截至2026年1月底,成员单位超过100家,预计其生态将在2027年迎来突破发展,被众多数据中心接纳,成为英伟达NVLink的有力挑战者[10] - AMD超节点Helios机架采用双宽机架设计,在复杂性、可靠性和性能间实现良好平衡,是目前业界最能挑战英伟达NVL72机柜的竞品之一[10] - 在功耗领域,Helios机架对比英伟达GB200 NVL72机柜优势显著,且双宽结构为未来升级(如扩展至144 GPU配置)预留了物理空间[10] 6. 行业技术路线与协议格局 - 目前四家头部厂商均推出各自的Scale-up协议:英伟达采用自研NVLink;谷歌采用私有ICI协议;AMD主导开放标准UALink;华为推出自研灵衢协议[34] - Scale-up网络主要有两个技术方向:一是封闭的私有技术方向,以英伟达、谷歌为代表;二是基于以太网的开放技术方向,以UALink和华为灵衢(2.0版后开放)为代表,两者均处于生态建设初期[38] - 各协议特点对比:英伟达NVLink和谷歌ICI Link为专有协议;UALink基于标准以太网组件,是开放标准;华为灵衢从2.0版起转向开放标准[39]
东兴证券晨报-20260303
东兴证券· 2026-03-03 22:06
核心观点 1) 地缘政治冲突(美以伊军事冲突)导致国际油价大幅跳涨,霍尔木兹海峡运输受阻可能加剧供应风险,推动油价持续上行 [6][7][10] 2) 超节点与Scale up网络是AI算力基础设施的关键,谷歌、AMD及华为等厂商正通过差异化技术路径挑战英伟达的领先地位,市场格局面临重塑 [13][24] 经济与行业政策动态 - **外交部**回应国际热点:中美就元首互动保持沟通;否认中国与伊朗达成CM-302导弹采购协议;敦促各方停止在伊朗的军事行动 [3] - **商务部**强烈反对英国对中国企业的单边制裁,将采取必要措施维护中国企业权益 [3] - **国家税务总局**数据显示,《互联网平台企业涉税信息报送规定》实施后,已有**8000余家境内外平台**报送信息,市场秩序得到规范 [3] - **市场监管总局**印发方案,目标到**2027年底**基本建成全国统一的检验检测智慧监管平台 [3] - **人形机器人**产业发布国内首个国家级标准体系——《人形机器人与具身智能标准体系(2026版)》 [3] - **光伏组件综合利用**获政策指导:目标到**2027年**,综合利用量累计达**25万吨**;到**2030年**形成应对大规模退役潮的利用能力 [3][4] - **国家能源局**召开绿色燃料产业发展座谈会,强调系统谋划、创新引领以推动产业健康有序发展 [5] - **海关总署**表示将大力促进跨境贸易便利化,支持中间品贸易、跨境电商等新业态发展 [5] - **钛白粉行业**出现涨价,多家企业产品国内市场价格上调**500元/吨**,国际市场价格上调**100美元/吨** [5] 石油石化行业分析 - **油价大幅上涨**:受美以伊军事冲突影响,截至北京时间**2026年3月2日**,WTI开盘价**75.00美元/桶**,较前收盘价上涨**11.9%**;布伦特开盘价**81.57美元/桶**,较前收盘价上涨**11.94%** [6][10][11] - **现货价格普涨**:截至**2026年2月27日**,Brent现货价环比上月涨**3.47美元/桶**至**70.84美元/桶**(涨幅**5.15%**);WTI现货价涨**2.00美元/桶**至**65.21美元/桶**(涨幅**3.16%**);中国大庆原油均价涨**5.37美元/桶**至**66.61美元/桶**(涨幅**8.76%**) [7] - **地缘风险推高溢价**:冲突导致多家航运巨头暂停通过霍尔木兹海峡,该海峡承载全球**1/5**的油气运输,若长期中断,油价可能持续上涨 [6][7] - **OPEC+决定增产**:宣布于**2026年4月**日均增产**20.6万桶**以稳定供应 [8] - **美国市场数据**: - 截至**2026年2月20日**,炼油厂产能利用率环比下降**2.3个百分点**至**88.6%** [8] - 车用汽油供应量环比下降**0.25%**至**8733千桶/天**;库存量环比下降**0.92%**至**254,834千桶** [8] - 石油产品供应量环比上升**3.77%**至**21,455千桶/天** [8] - **2026年2月**,原油进口量均值环比上升**2.68%**至**6,371.33千桶/日**;出口量均值环比上升**1.84%**至**4,255.60千桶/日** [8] - **潜在供应调整**:若中东冲突持久,亚洲原油进口国可能转向增加俄罗斯及西非石油进口以弥补缺口 [9] 超节点与Scale up网络行业分析 - **行业定位**:超节点与Scale up网络是突破算力与通信瓶颈、支撑万亿级大模型与高实时性应用的关键基础设施,涉及算力芯片、网络部件、存储、供电散热等多个领域 [13] - **英伟达(NVDA)**: - 超节点技术领先,优势建立在**NVLink**和**NVLinkSwitch**上 [14][15] - **NVLink5 Switch**支持单GPU到GPU带宽**1800GB/s**,可构建**72**颗GPU的NVLink域,总带宽达**130TB/s**(双向) [15] - 计划推出Vera Rubin NVL144和Rubin Ultra NVL576,互联GPU数将向**576**颗发展,并引入**NVLink Switch Blade** [14] - 面临**Scale up网络**发展空间可能限制其领先优势的挑战 [15] - **华为**: - 推出开放标准的**灵衢互联协议**,但尚未被国内业界广泛接受,国内正推动**CLink**等统一标准 [17][18] - **Atlas 950**超节点预计**2026年第四季度**发布,算力达**8 EFLOPS(FP8)**,内存容量**1152TB**,互联带宽**16.3 PB/s**,性能参数领先同期英伟达产品 [18] - 采用“柜内正交铜互联+柜间光互联”的混合设计以控制总体拥有成本(TCO),显示技术仍在标准化阶段 [19] - **谷歌(GOOGL)**: - 建立基于**光电路交换机(OCS)**的超节点,技术路线独树一帜,构筑了高技术壁垒 [20][21] - **OCS交换机**相比电分组交换机,每比特能耗低数个数量级,时延极小 [21] - **TPUv7**已获外部认可,**Anthropic**将在**2026年**采购近**100万颗** TPUv7 Ironwood AI芯片 [20] - 计划在**2027年**推出第8代TPU,对标英伟达Vera Rubin [20] - **AMD(AMD)**: - 推动**UALink**成为重要开放标准,截至**2026年1月底**联盟成员超**100家**,有望挑战英伟达NVLink [22][23] - **Helios机架**采用双宽设计,在复杂性、可靠性和性能间平衡良好,是英伟达NVL72机柜的有力竞品,且在功耗领域优势显著 [23] - **竞争格局与投资策略**: - 自**2025年**起,超节点成为AI算力网络重要创新方向,竞争从芯片延伸至“芯片+Scale up网络” [24] - 除芯片厂商外,**微软、Meta、亚马逊**及中国的**移动、阿里、腾讯、百度**等众多厂商加入竞争 [24] - 英伟达目前领先,但格局未定。**2025年**英伟达股价累计涨幅**38%**,显著落后于谷歌、AMD及A股中证算力指数,市场正对挑战者进行价值重估 [24] - 投资关注点:1)谷歌、AMD及国内超节点厂商;2)超节点供应链(PCB背板、高速铜缆、光模块、供电与液冷);3)**OCS交换机**核心零部件与**UALink**标准下的交换机芯片 [25] 重要公司资讯 - **泰晶科技**:主营业务产品可应用于人形机器人、光模块,但相关业务处于市场推广期,收入占比极少 [5] - **亚盛集团**:澄清目前未开展矿产相关业务 [5] - **法兰泰克**:公司股票将于**2026年3月3日**开市起复牌 [5] - **向日葵**:公司及相关当事人收到浙江证监局的《行政处罚事先告知书》 [5] - **天华新能**:拟发行H股股票并在香港联交所主板挂牌上市 [5] 东兴证券三月金股推荐 - 推荐标的包括:宁波银行、北京利尔、兴森科技、牧原股份、中矿资源、甘源食品、华测导航、中科海讯 [2]