英伟达GB200 NVL72

搜索文档
计算机行业周报:超节点:从单卡突破到集群重构-20250709
申万宏源证券· 2025-07-09 15:44
报告行业投资评级 - 看好 [3] 报告的核心观点 - 大模型参数爆炸式增长驱动下,算力需求从单点转向系统级整合,超节点在机柜级互联与跨机柜组网技术上取得突破,单柜高密度与多机柜互联双向扩展,背后是通信协议与工程成本的平衡 [4] - 国产超节点方案以华为 CloudMatrix 384 为代表,实现算力规模突破,打破单卡性能瓶颈,验证了国产方案在大规模组网中的工程能力 [4] - 超节点产业化将重塑算力产业链分工,催生服务器整合、光通信增量及液冷渗透提升等投资机会,芯片厂商纵向整合趋势明显 [4] - 市场当前对超节点的认知存在两大预期差,一是低估国产方案在推理场景的性价比优势,二是忽视算力网络架构变革对产业链的重构 [4] - 建议关注光通信、网络设备与芯片、数据中心产业链、铜连接、AI 芯片与服务器供应商等领域相关标的 [4] 根据相关目录分别进行总结 超节点:AI 算力网络新趋势 - Scale up 和 Scale out 是算力系统扩容的两个重要维度,分别追求硬件紧密耦合和弹性扩展,二者在协议栈、硬件、容错机制上存在本质差异,通信效率不同 [15] - 英伟达在 Hopper GPU 一代尝试突破服务器架构、在机柜层级拓展 Scale up 系统,2024 年推出的 GB200 NVL72 是较为成熟的超节点产品,通过单层 NVSwitch 实现全互联,应对通信峰值能力显著提升 [27][32] - AMD 的 IF128 方案尝试融合以太网技术,打破 Scale-up 与 Scale-out 边界,预计将在 26H2 推出搭载 128 个 MI450X 的超节点产品 [38][43] - 特斯拉 Dojo 专为视频等视觉训练数据打造,采用 2D Mesh 拓扑结构,但进展不及预期,其封闭生态和 2D Mesh 拓扑结构为重要掣肘 [50][67] 超节点掣肘?华为的解答 - 超节点设计需考虑模型需求、IDC 实践和成本等因素,在模型角度 72 卡规模以上的 Scale up 节点是较优选择,未来更大规模的超节点预计是必然选择;在 IDC 实践角度,模块化布局利于交付和运维;在成本角度,光通信等组网成本、系统复杂度和维护制约了超节点 Scale up 的规模设计 [72][77][79] - 华为 CloudMatrix 384 超节点通过两层 UB Switch 实现全互联,形成无带宽收敛的 Clos 网络拓扑,实测数据显示其对性能影响较小,该超节点算力为 NVL72 的 1.7 倍,内存为 3.6 倍,更适合未来 AI 工作负载 [82][92][95] - 华为 CM384 机柜为推理而生,针对 Prefill 和 Decode 两大阶段进行了针对性优化;深度适配 DeepSeek,机柜内资源调度灵活性强,但多机柜灵活性差;在国产 AI 芯片方案中已经具备一定性价比,体现在单算力的吞吐 [100][107][119] 产业链影响:分工细化,各环节均有增量 - 服务器产业链分工细化,AI 芯片厂商纵向整合,提升自身通信、存储、软件等能力是确定趋势,代工产业链分工可能进一步分化为板卡设计代工供应商、以及机柜代工供应商,相关标的包括海光信息、中科曙光等 [123][128] - 光通信方面,国产超节点方案带来光模块增量,预计增加 400G 或 LPO 等成本优化方案的采购,同时加速向 800G 演进,整体光模块的需求比最高可达 1:18,相关标的包括华工科技、光迅科技等 [129][139] - 铜连接方面,华为 UB-Mesh 网络架构具备降低成本、增强可靠性等特性,更长时间维度看,光通信是 Scale up 网络需求的演进方向,光电混合是当前重要架构,相关标的包括意华股份、瑞可达等 [140][144] - IDC 产业链方面,以 Cloud Matrix 为代表的超节点方案预计将增加 AIDC 需求,液冷是必要选项,相关标的包括润泽科技、奥飞数据等 [149][151] 重要公司估值 - 报告给出了海光信息、中科曙光、浪潮信息等多家公司 2024A-2027E 的归母净利润及 PE 等估值数据 [153]
用“系统工程”打破算力封锁 昇腾的另类突围路径
每日经济新闻· 2025-06-17 13:56
昇腾算力技术突破 - 昇腾384超节点已开始发货,这是目前业界规模最大的超节点,由384颗昇腾AI芯片组成集群,提供高达300 PFLOPs的密集BF16算力,性能接近英伟达GB200 NVL72系统的两倍 [1] - 华为通过系统工程方法优化计算、内存、通信调度,实现算力超越,内部组织算力会战整合各领域专家能力 [1] - 昇腾超节点采用全对等高速互联架构,打破传统以CPU为中心的冯诺依曼架构,扩展总线至整机柜甚至跨机柜 [7] 国产算力发展背景 - 美国对华芯片出口管制持续加码,影响英伟达约55亿美元的季度费用 [2] - 昇腾算力战略意义远超商业价值,正从被迫替代转向主动选择 [3][5] - 昇腾计算产业已发展为包括芯片、硬件、CANN、AI计算框架等全产业链体系 [4] 技术架构创新 - 采用自有标准"全对等互联架构",统一通信协议提升有效载荷,打造基于中国标准的解决方案 [8] - 引入光通信技术,使用3168根光纤和6912个400G光模块实现跨机架纵向扩展 [8] - 解决散热难题,采用液冷散热方案和高效风冷方案,研发微结构材料提升热传导效率 [8] 软件生态建设 - 华为CANN平台快速补齐高质量基础算子,核心算子从数万个收敛至数百个 [10] - 提供Day0迁移和一键部署工具链,支持客户采用混合策略逐步迁移至昇腾平台 [10] - 组建"小灵巧突击队"深入客户现场提供技术支持 [6] 能耗与性能平衡 - 昇腾384超节点功耗达英伟达NVL72的4.1倍,每FLOP功耗高出2.5倍 [11] - 国内电力供应相对充裕,无需受限于能耗约束 [11] - 将持续通过技术进步改进能源消耗,构筑AI时代核心竞争力 [11] 行业影响与意义 - 昇腾384超节点打破了国产算力"无法训练大模型"的质疑 [12] - 构建了英伟达之外的可靠第二选择 [12] - 开辟了不同于西方的创新路径,通过系统工程实现规模算力领先 [12]
华为“算力核弹”超越英伟达的秘密
观察者网· 2025-06-12 22:21
行业趋势 - AI算力竞赛进入"系统级对决"时代,单卡性能的"摩尔定律神话"正被架构革命重构 [1] - 中国AI算力生态从"单点突围"转向"系统升维",计算-存储-网络协同创新成为关键 [1] - 大模型Scaling Law推动算力需求指数级增长,集群化、系统化算力方案成为大势所趋 [11] 华为昇腾CLoudMatrix 384超节点技术 - 算力规模达300PFlops,反超英伟达NVL72达70%,网络互联带宽提升107%,内存带宽提升113% [14] - 采用"全对等架构"重构传统计算架构,通过高速互联总线实现CPU、NPU、存储等资源池化,通信带宽提升15倍,时延降低10倍 [18][20] - 应用3168根光纤和6912个400G光模块,突破传统铜线传输距离限制,支持跨机柜扩展 [20][21] - 支持万卡级扩展能力,可构建Atlas 900 SuperCluster超节点集群,目标"终结行业算力焦虑" [7][14] 英伟达竞争态势 - 英伟达GB200 NVL72超节点采用NVLink技术,总算力180PFlops,网络带宽130TB/s,内存带宽576TB/s [12] - 中国市场占比从95%降至50%,黄仁勋公开承认华为技术超越,呼吁美国政府放宽管制 [5][9][22] - 最新禁令导致英伟达计提55亿美元库存损失,2025财年收入1305亿美元(同比+114%),净利润729亿美元(同比+145%) [5] 国产算力实践突破 - 华为云在昇腾平台实现准万亿盘古Ultra MoE模型全流程训练,验证国产算力全链条自主能力 [1][26] - DeepSeek MoE模型在昇腾超节点实现媲美英伟达H100的推理效果,支持一卡一专家分布式推理 [25] - 华为液冷技术使数据中心PUE降至1.12,比行业平均节能70%,超节点功耗为英伟达4.1倍但电力供应非制约因素 [27][28] 技术封锁下的创新路径 - 华为提出"用数学补物理"、"非摩尔补摩尔"、"系统补单点"三大思想,基于现有工艺实现架构突破 [11] - 光通信等传统优势技术跨域复用,凸显中国在系统级创新中的独特路径 [1][21] - 昇腾云脑实现"1-3-10"故障响应标准,1分钟感知、3分钟定位、10分钟恢复 [21]
从CoreWeave视角看算力租赁行业
傅里叶的猫· 2025-06-09 21:40
公司概况 - CoreWeave成立于2017年,前身为加密货币挖矿企业Atlantic,2019年转型聚焦AI云和基础设施建设 [2] - 截至2024年底运营32个数据中心,主要位于美国低电力成本区域,并在欧洲科技中心设立节点 [2] - 累计部署超过25万颗GPU,主要为英伟达Hopper架构产品,是H100、H200、GH200的高性能基础设施云服务商 [2] - 首家全面提供英伟达GB200 NVL72的云厂商 [2] 业务模式 - 提供三类服务:基础设施及服务(裸金属GPU租赁)、管理软件服务(Cloud Net Service)、应用服务(SUNK服务等) [3] - 核心业务为基础设施及服务,采用英伟达InfiniBand架构,适合AI训练和渲染等高强度任务 [3] - 商业模式包括承诺制合同(占2024年收入的96%)和按需付费模式 [4][5] - 承诺制合同期限2-5年,客户需支付合同价值15%-25%的预付款,确保稳定现金流 [4] - 按需付费模式适合突发工作负载和中小客户试用,提升算力利用率 [5] 股东结构 - 英伟达持股3.86%,作为战略股东保障GPU优先供应 [6] - 管理基金为第一大股东,创始人团队通过双重股权结构掌握83%投票权 [6] 核心优势 - 算力利用率优化,模型浮点利用率比行业平均水平高20% [7] - 专为AI打造的平台架构,提高机架密度和数据中心利用率 [7] - 规模化运营能力,25万颗GPU形成规模经济效应 [7] - 电力资源充沛,拥有500兆瓦容量协议和360兆瓦可用电力合约 [7] 财务表现 - 2024年营收19.15亿美元,同比增长超7倍 [8] - 2025年一季度营收9.82亿美元,同比增长4倍以上,环比增长31% [8] - 2024年亏损8.63亿美元,2025年一季度亏损3.15亿美元,主要因财务费用和股权激励 [8][9] - 毛利率2024年为74%,2025年一季度为73.3%,同比提升4个百分点 [9] 行业前景 - AI基础设施市场规模2023-2028年将从790亿美元增长到3990亿美元,年复合增速38% [11] - 行业玩家包括传统云服务商和新型GPU服务商,活跃度显著提升 [11] - H100价格呈下降趋势,NL72推理单位成本比H100降低75% [12] - 国内算力租赁行业在一季度表现显著,部分公司业务已反映业绩贡献 [13] 未来增长点 - 挖掘现有客户需求,拓展新行业如银行、制药等 [10] - 国际化扩张,在北美、欧洲、亚太发展IDC [10] - 加强垂直整合,确保GPU优先获取并构建全栈软件能力 [10] - 管理层重心包括电力合同落地、融资保持低杠杆、平台差异化和并购扩张 [10]
GPU集群怎么连?谈谈热门的超节点
半导体行业观察· 2025-05-19 09:27
超节点服务器概念与背景 - 超节点服务器是应对AI算力需求爆炸式增长的最优解,通过高效整合海量计算单元(CPU/GPU/TPU)实现前所未有的计算密度和效率[4][6] - AI模型参数从亿级跃升至万亿级,传统服务器显存和算力无法满足需求,模型并行成为必然选择但受限于服务器间网络带宽瓶颈[9] - 超节点三大核心特征:极致计算密度(单空间最大化算力)、强大内部互联(NVLink等技术)、AI负载深度优化(软硬件协同设计)[10] 技术演进历程 - 早期追求服务器密度的尝试(如1999年谷歌"软木板服务器")与超节点有本质区别,前者侧重资源池化而非算力整合[12] - GPU并行计算能力崛起成为关键转折点,Transformer等大模型推动NVLink等高速互联技术发展[13] - 英伟达DGX/HGX系列将8GPU+NVSwitch高度集成,形成典型超节点单元[14] 行业需求驱动因素 - AI大模型遵循规模定律(Scaling Law),模型规模与训练数据量增长直接带来算力需求指数级上升[16] - 长序列处理需求提升模型性能但显存需求急剧增加,2025年斯坦福报告显示训练算力年增长率达10倍[18][20] - 传统扩展方式面临三大瓶颈:内存墙(数据供给不足)、规模墙(集群扩展收益递减)、通信墙(并行计算通信开销)[21] 技术优势与解决方案 - 构建超大带宽域(HBD)实现纵向扩展(Scale-Up),8GPU服务器内通信带宽达130TB/s[22][37] - 集中式供电方案提升效率,液冷技术使PUE优于传统风冷,长期运营成本降低[24][26] - 模块化设计优化运维,大型风扇墙和集成电源组件比传统方案节能30%以上[26][29] 关键技术挑战 - 供电系统需应对100kW+机柜功耗,电压从48V向400/800V演进以减少线路损耗[31] - 冷却系统采用冷板式/浸没式液冷应对单芯片1000W+ TDP,散热效率提升5-10倍[32] - 网络系统需平衡铜缆/光缆成本与性能,InfiniBand和RoCE成为主流互联方案[32][37] 行业技术现状 - 英伟达GB200 NVL72集成72个Blackwell GPU,采用NVLink实现36CPU+72GPU逻辑统一,定义行业标准[35][37] - 华为CloudMatrix 384通过384颗昇腾芯片全光互联实现自主可控,但功耗较高[38][41] - 供电技术向48V直流母线槽演进,液冷采用直触式冷板技术,网络倾向RoCE以太网[33][34][37] 未来技术方向 - 数据中心供电向400V/800V高压直流(HVDC)转型,减少AC-DC转换损耗[40][43] - 下一代液冷技术包括微流控冷却(芯片表面蚀刻微通道)和相变液冷(利用潜热)[45] - 共封装光学(CPO)技术将光模块集成至芯片封装,提升I/O带宽密度并降低功耗[49] 行业影响与展望 - 超节点是AI算力基础设施的集大成者,融合芯片/互联/制冷/供电等尖端技术[46] - 技术演进将催生全新系统架构,如计算/内存/存储资源池化通过光路互联[49] - 行业正从单机柜级向跨机柜级超节点发展,推动AI集群算力规模突破现有上限[22][41]
中银证券:成长主线不改,A股蓄势待催化
智通财经网· 2025-05-18 19:56
市场大势与风格 - 短期A股市场缺乏有力上行催化 但基本面修复及政策释放预期尚未证伪 市场下行风险有限 [1] - 中美日内瓦经贸会谈达成联合声明 双方同意大幅降低双边关税水平 航运及化工品受益 [2] - 4月社融存量同比增速回升至8.7% 预示基本面及A股盈利上行趋势不改 [2] - 权重股增配行情对市场风格构成短期扰动 经济弱复苏+信用磨底+宽货币环境下成长主线不改 [2] 大类资产表现 - MSCI发达市场本周涨4.08% 年初以来涨4.19% MSCI新兴市场本周涨2.98% 年初以来涨9.01% [3] - 标普500本周涨5.27% 5月累计涨6.99% 年初以来涨1.30% [3] - 万得全A本周涨0.72% 5月累计涨3.06% 年初以来涨1.71% [3] - WTI原油本周涨1.49% 5月累计涨6.39% 年初以来跌13.65% [3] - 10Y美债收益率本周上行6Bps 年初以来下行23Bps [3] 宏观经济数据 - 美国4月CPI同比2.3% 环比0.2% 核心CPI同比持平于2.8% [5] - 美国4月核心PPI同比2.5% 环比0.4% [5] - 欧元区5月ZEW经济景气指数大幅回升30.1点至11.6 [5] - 中国4月社会融资规模存量同比增速回升0.3个百分点至8.7% [5] 中观行业表现 - 中美关税谈判落地 电商/化纤/航运港口等行业涨幅居前 [15] - 电新行业因减产挺价方案涨幅居前 非银行业受公募高质量发展行动方案影响涨幅第二 [15] - 军工行业受印巴军事冲突停战影响表现垫底 [15] 科技行业动态 - 腾讯阿里2025Q1资本开支环比回落但仍高于近年平均水平 腾讯274.76亿元 阿里246.00亿元 [25] - 华为Cloud Matrix 384算力集群在集群算力规模(300PFLOPS)和总内存容量(49.2TB)等指标超越英伟达GB200 NVL72 [31][32] - 美国加大对华算力芯片限制 寒武纪等国产算力厂商存货增至27.6亿元 订单需求旺盛 [26][30] 行业配置建议 - 电子/计算机/自动化设备/新兴消费/通信等行业综合评分33分以上 建议高配 [33] - 医药/银行/家用电器/建材等行业评分28-29分 建议高配 [33] - 国防军工/传媒/白酒等行业评分27分 建议标配 [33] - 房地产/煤炭/公用事业等行业评分21分以下 建议低配 [33]
策略周报:蓄势待催化
中银国际· 2025-05-18 19:00
市场趋势 - 4月社融存量同比增速回升至8.7%,预示基本面及A股盈利上行趋势不改[3][12] - 中美协议及宽货币阶段性落地,短期市场或缺乏有力上行催化,进入热点及风格加速轮动阶段[3][12] - 经济弱复苏、信用磨底、宽货币环境下,成长主线不改,等待增量催化因素[3][12] 行业表现 - 本周与出口相关性较高的行业如电商、化纤、航运港口等涨幅居前,军工行业表现垫底[28] - 本周BOCIASI快线和慢线指标分别于周一(58.4%)及周三(33.6%)触及本轮关税冲突修复以来的高点,科技行业股价修复趋势有所走弱[3][29] 企业动态 - 腾讯、阿里2025年Q1资本开支环比回落,但绝对量仍高于近年平均水平,腾讯、阿里Q1资本开支分别达274.76亿元、246.00亿元[35][40] - 美国加大对华算力芯片限制,短期或影响华为芯片出口,但强化国产算力芯片需求,寒武纪存货与订单稳步恢复[36][40] - 华为Cloud Matrix 384算力集群性能在多项关键指标上超越英伟达GB200 NVL72[39] 资金流向 - 本周A股市场主力资金净卖出66.59亿元,汽车、非银、交运资金净流入规模居前,计算机、电子和传媒净流出规模最大[44] - 本周股票型ETF场内净赎回金额为323.99亿元,连续第4周净赎回,单周净赎回规模创3个月以来最大[44] 中概股情况 - 中概股问题再成中美博弈筹码,港股承接预期和中国基本面韧性使部分投资者逆势布局[3][49] - 近年来中资企业赴美上市数量稳定,平均融资规模缩量,2025年至今赴美上市中资股平均首发募资总额下滑[49]
策略周报:蓄势待催化-20250518
中银国际· 2025-05-18 18:03
报告核心观点 - 基本面预期或迎阶段性落地,短期市场或进入热点及风格加速轮动阶段,成长主线不改,新一轮趋势形成可等待增量催化因素 [3] - 科技行业股价修复趋势有所走弱,但风偏一旦修复,潜在弹性更高,关注算力芯片限制对华出口预期下相对受益的算力芯片、算力租赁等 [3] - 中概股问题再成为中美博弈筹码,港股承接预期和中国基本面韧性使部分投资者选择逆势布局 [3] 观点回顾 - 20240204《等待资金面问题缓解》提出被动卖出和购买意愿寡淡是当前资金面主要矛盾,经济数据修复将成为市场底部反转关键 [10] - 20240407《财报季关注盈利因子配置方向》认为强势非农数据或推后美联储降息时点,4 月市场进入业绩窗口期及政策落地期,对盈利端的预期将有望迎来市场重新计价 [10] - 20240804《海外降息有望释放 A 股压力》指出海外衰退宽松交易渐起,政治局会议表述更为积极,权益市场短期或将迎来"东升西降" [10] - 20241215《重回跨年配置行情主线》表明重要会议定调下,新兴消费与"AI+应用"作为跨年主线的线索明确 [10] - 20241216《重回科技主导产业——2025 年度策略报告》提出盈利弱复苏,估值强支撑,科技和高端制造业有望成为市场主导 [10] - 20250209《指数与情绪共振:AI Infra 向上重估》认为 A 股性价比优势凸显,DeepSeek 产业驱动下,AI Infra 有望率先反应 [10] - 20250216《DeepSeek 行情的二阶段:聚焦云计算和 AI 应用》指出 DeepSeek 高性价比凸显之下,云计算正在成为大模型时代的"卖水人",应用端重点关注医疗、企服、教育、办公、金融、营销等垂直领域 [11] 大势与风格 - 本周初中美日内瓦经贸会谈达成联合声明,双方同意大幅降低双边关税水平,提振市场信心,叠加 4 月外贸数据,短期抢转口预期升温,航运及化工品受益 [12] - 4 月金融数据显示政府债支撑下新增社融维持同比多增趋势,但新增信贷季节性回落,社融存量同比增速回升至 8.7%,预示基本面及 A 股盈利上行趋势不改 [12] - 下周 4 月经济数据将披露,预计 4 月内需上行动能环比趋缓,中美协议及宽货币阶段性落地,短期市场缺乏有力上行催化,但基本面修复及政策释放预期未证伪,市场下行风险有限,或进入热点及风格加速轮动阶段 [12] - 风格上,权重股增配行情对市场风格构成短期扰动,经济弱复苏+信用磨底+宽货币环境下,成长主线不改,新一轮趋势形成可等待增量催化因素 [12] 中观行业与景气 - 中美关税谈判落地,行业涨多跌少,与出口相关性较高的电商、化纤、航运港口等行业涨幅居前,电新行业因部分头部厂商减产挺价新闻涨幅排名居前,非银行业因公募高质量发展行动方案周三大幅上涨,军工行业受印巴军事冲突停战影响表现垫底 [28] - 本周 BOCIASI 快线和慢线指标分别于周一(58.4%)及周三(33.6%)触及本轮关税冲突修复以来的高点,科技行业股价修复趋势走弱,反弹后震荡蓄势或成市场阶段共识,但市场风格不会单边重回红利,相对低位的科技板块风偏修复后潜在弹性更高 [29] - 腾讯、阿里 2025 年 Q1 资本开支环比回落明显,但绝对量仍高于近年平均水平,资本开支回落有供应链稳定问题,环比下滑更多是节奏而非趋势 [35] - 美国加大对华算力芯片限制,短期或影响华为芯片出口,但强化了国产算力芯片需求,寒武纪等存货与订单稳步恢复,华为 Cloud Matrix 384 算力集群性能不逊色于 GB200 NVL72,国产算力芯片从"能用"走向"好用",关注算力芯片、算力租赁等受益行业 [36][40] 一周市场总览、组合表现及热点追踪 - 本周 A 股市场主力资金净卖出 66.59 亿元,环比由净买入转净卖出,资金净流入最多的行业是汽车(96.70 亿元),非银、交运分列二、三,资金净流出规模最大的三个行业是计算机、电子和传媒 [44] - 本周股票型 ETF 场内净赎回金额为 323.99 亿元,为连续第 4 周净赎回,单周净赎回规模创 3 个月以来最大,份额增加最多的五只 ETF 集中在科创板、半导体、军工等领域,减少最多的五只 ETF 集中在核心指数领域 [44] - 中概股问题再成中美博弈筹码,近年来中资企业赴美上市数量稳定,平均融资规模缩量,2025 年至今赴美上市中资股平均首发募资总额下滑,近三年中概股整体市值扩容放缓 [49] - 已在港上市的中概股若面临美股强制退市,双重主要上市个股在港不受影响,第二上市个股的港股部分自动转为主要上市,港交所视情况给予宽限期,行业赴港 IPO 和再融资呈现出 AI 与机器人、新消费、有色金属等行业的规律 [52]