英伟达NVL72
搜索文档
超节点互连技术落地 国产万卡超集群首次真机亮相
21世纪经济报道· 2025-12-19 21:32
行业趋势:算力需求与架构演进 - 主流大模型参数已从千亿级跃升至万亿级规模,驱动算力需求持续爆发式增长,EFLOPS算力级别、万卡级别高性能集群成为大模型标配 [2] - 为满足苛刻的算力要求,行业正从追求通用性和灵活性的解耦设计,转向通过牺牲部分通用性以换取性能极致优化的新架构 [3] - 构建大规模智算集群的主流架构思路是:先通过Scale-up策略将数百张加速卡集成为内部高速互联的超节点,再将这些超节点作为标准单元进行Scale-out横向扩展,最终构筑万卡规模集群 [6] - 行业目标持续升级,从千卡、万卡集群向未来的几十万卡甚至百万卡集群迈进,高速互连的重要性愈加凸显 [7] 产品创新:超节点与万卡集群 - 超节点因密度和性能优势,正成为新建万卡集群的首选架构之一,其将大量AI加速卡以超高密度集成在单个或少数几个机柜内,通过内部高速总线或专用互连网络,实现“物理多机、逻辑单机”的新型计算单元 [3] - 中科曙光于2025年11月发布全球首个单机柜级640卡超节点——scaleX640,这是全球已公开的在单个机柜内集成加速卡数量最多的超节点产品 [3] - scaleX640采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04 [1] - 中科曙光于2025年12月18日发布并展出了scaleX万卡超集群,由16个scaleX640超节点通过scaleFabric高速网络互连而成,实现10240块AI加速卡部署,总算力规模超5EFlops,这是国产万卡级AI集群系统首次以真机形式亮相 [4][5] - 华为昇腾384超节点真机也在2025年世界人工智能大会期间首秀,标志着国产算力“大基建”正从图纸走进现实 [1] 技术突破:高速互连与网络 - 在单机柜内把芯片互连规模做大,可以让芯片之间的互连更加可靠、高效,因为柜内互联采用高效低成本的电信号,而柜间则依赖高功耗、高成本的光模块 [3] - 在超节点间,曙光scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,并可将超集群规模扩展至10万卡以上 [7] - 相比传统IB网络,scaleFabric网络性能提升2.33倍,同时网络总体成本降低30% [7] - 自研原生RDMA高速网络至关重要,其角色类似于英伟达生态中基于Mellanox技术的InfiniBand网络,承担着节点间Scale-Out的重任 [7] 挑战与产业链影响 - 超节点面临海量芯片协同工作带来的系统散热压力、多芯片间光/铜混合互连方案引发的稳定性问题,以及多零部件长期运行下的可靠性隐患等复杂系统性挑战 [8] - 解决上述问题需要服务器厂商与上游各环节厂商深度协同,探索全局最优解决方案,这使得整机环节在产业链中的话语权显著提升 [8] - 当智算集群规模扩展至万卡乃至十万卡级别,集群设计与建设面临可扩展性、可靠性与能效三大核心挑战 [8] - 为保证可扩展性,必须构建具备高带宽、低延迟的强大互连网络,确保集群规模增长时计算效率不会出现断崖式下降,并实现大规模组网下的有效管理 [8] - 可靠性方面,海量设备数量累加会遵循“木桶效应”,即便单点可靠性极高,整体系统的无故障运行时间也会被指数级拉低 [8] - 最紧迫的是能耗与能效问题,随着单个算力中心体量从MW级向未来GW级演进,传统的供电技术已难以为继,必须实现供电技术的根本性突破,并辅以先进的软件管理调度 [8]
超节点互连技术落地,国产万卡超集群首次真机亮相
21世纪经济报道· 2025-12-19 21:24
行业趋势:AI算力需求爆发与集群规模演进 - 主流大模型参数从千亿级跃升至万亿级规模,算力需求持续爆发式增长,EFLOPS算力级别、万卡级别高性能集群成为大模型标配[1] - 超节点因密度和性能优势,正成为新建万卡集群的首选架构之一[1] - 行业构建大规模智算集群的主流架构思路是:先通过Scale-up策略将数百张加速卡集成为超节点,再将这些超节点作为标准单元进行Scale-out横向扩展,最终构筑万卡规模[5] - 集群规模持续扩大,从千卡、万卡发展到未来的几十万甚至百万卡,国际上Meta、微软、OpenAI等AI巨头已陆续宣布或完成10万卡集群建设[6][7] 技术突破:国产万卡级AI集群真机亮相 - 中科曙光在HAIC2025大会上发布并展出了scaleX万卡超集群,这是国产万卡级AI集群系统首次以真机形式亮相[1] - 此前国内万卡集群项目多以分散服务器、技术蓝图或在建工程形式存在,例如三大运营商已投产的万卡集群多为分散部署的标准服务器,物理形态并非一体化单元[1] - 同样在2025年,华为昇腾384超节点真机也在世界人工智能大会期间首秀,标志着国产算力“大基建”正从图纸走进现实[1] 产品核心:scaleX万卡超集群与scaleX640超节点 - scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超5EFlops[1][3] - scaleX640是全球首个单机柜级640卡超节点,采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04[1] - scaleX640是全球已公开的、在单个机柜内集成加速卡数量最多的超节点产品[2] 技术架构:超节点的设计逻辑与优势 - 超节点是一种Scale-up纵向扩展解决方案,将大量AI加速卡以超高密度集成在单个或少数几个机柜内,通过内部高速总线或专用互连网络,实现“物理多机、逻辑单机”的新型计算单元[2] - 当前算法对算力的苛刻要求,迫使业界牺牲部分通用性以换取性能的极致优化,超节点应此需求而生[2] - 在单机柜内把芯片互连规模做大,可以让芯片之间的互连更加可靠、高效,因为柜内互联采用高效低成本的电信号,而柜间依赖高功耗、高成本的光模块[2] - 中科曙光、华为Atlas超节点、英伟达NVL72等产品均已应用超节点架构[2] 关键挑战:大规模集群的系统性难题 - 当智算集群规模扩展至万卡乃至十万卡级别,集群设计与建设面临可扩展性、可靠性与能效三大核心挑战[8] - 可扩展性挑战:必须构建具备高带宽、低延迟的强大互连网络,确保集群规模增长时计算效率不会出现断崖式下降,并实现大规模组网下的有效管理[8] - 可靠性挑战:海量设备数量累加遵循“木桶效应”,即便单点可靠性极高,整体系统的无故障运行时间也会被指数级拉低[8] - 能耗与能效挑战:随着单个算力中心体量从MW级向未来GW级演进,传统供电技术已难以为继,必须实现供电技术的根本性突破,并辅以先进的软件管理调度[8] - 超节点面临复杂的系统性挑战,包括海量芯片协同带来的系统散热压力、光铜混合互连方案引发的稳定性问题、多零部件长期运行下的可靠性隐患,这类问题需要服务器厂商与上游各环节深度协同解决[7] 网络互连:高速互连技术的重要性与突破 - 随着集群规模从千卡、万卡向几十万卡发展,高速互连的重要性愈加凸显[7] - 在超节点间,曙光scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,并可将超集群规模扩展至10万卡以上[7] - scaleFabric网络相比传统IB网络性能提升2.33倍,同时网络总体成本降低30%[7] - 自研原生RDMA高速网络至关重要,英伟达生态体系中的“三驾马车”包括:核心GPU提供算力、NVLink负责节点内超高速互联、基于Mellanox技术的InfiniBand网络承担节点间Scale-Out重任[7]
中信证券:看好超节点服务器整机环节 建议关注产业链相关公司
智通财经网· 2025-12-19 08:55
核心观点 - 超节点服务器作为适配MoE架构模型的底层AI基础设施基本计算单元,有望快速上量,并通过更高的技术附加值和系统整合角色提升整机环节的价值量 [1][5][7] 技术背景与需求 - MoE(混合专家)架构成为主流AI大模型追求更大参数与更高效率的选择,其专家并行计算模式在优化计算与访存瓶颈的同时引入了新的通信难题,催生了基于Scale up网络的超节点解决方案 [2] - 相较于传统八卡服务器,超节点面临海量芯片协同带来的系统散热压力、光铜混合互连的稳定性问题以及多零部件长期运行的可靠性隐患等系统性挑战 [2] 市场格局与发展阶段 - 海外超节点解决方案以英伟达NVL72和Google采用自研TPUv7芯片的Ironwood Rack(最大支持9216颗芯片集群)为代表 [3] - 国内近期涌现出华为CloudMatrix384、阿里磐久、曙光ScaleX640等超节点解决方案 [3] - 当前是超节点解决方案的早期发展阶段,技术方案呈现“百家争鸣”状态,未来预计将逐步收敛到有限方向 [3] 关键技术趋势 - **算力密度**:更大规模的Scale up域有望带来模型训练及推理的性能收益,但具体规模需结合成本与可靠性等因素,依赖技术发展确定 [3] - **网络拓扑**:胖树结构在通用性上或短期占据更高市场份额,而具备软硬件自研能力的大厂有望尝试3D-Torus等方案 [3] - **物理连接**:无背板正交方案在连接简洁性、机柜紧凑性方面具备优势,或将成为未来主流技术方案 [3] - **散热方案**:随着单机柜算力密度提升,PUE更接近1的液冷方案(如相变浸没液冷)若解决稳定性问题,将迎来更大发展机会 [4] 产业链价值重塑 - 传统八卡AI服务器产业链分工清晰,服务器厂商主要承担标准化零部件组装,技术门槛相对集中于单一部件 [5] - 超节点服务器的技术复杂度实现质的跃升,涉及多芯片功耗管控、高密度集成散热、整机柜级长期可靠性等系统性挑战 [5] - 服务器厂商角色从“组装者”转变为“系统整合者”,需从设计之初深度考量芯片、散热、互连等多部件耦合关系,通过跨环节技术协同解决问题 [5] - 这种系统化、一体化的设计与整合需求大幅提升了技术门槛,强化了整机环节在产业链中的话语权,使其成为把握技术方向与系统性能的核心枢纽,技术附加值有望显现 [1][5] 发展前景与投资关注 - 超节点技术方兴未艾,MoE架构料将成为大模型主流架构,其特殊性对硬件提出新要求 [7] - 超节点有望通过高效的网络通信及原生内存语义提供更优解决方案,并成为未来AI基础设施的底层计算单元 [1][7] - 算力密度提升、散热能力提升、稳定性和可靠性提升具备高确定性,相关技术为服务器整机制造带来新要求 [7] - 具备定制化开发能力及供应链管理能力的服务器厂商有望获得更大发展机会 [7]
功率器件在AI数据中心电源中的应用
2025-09-11 22:33
**纪要涉及的行业或公司** * AI数据中心电源行业 英伟达及其高端AI服务器产品(NVL72 GB200 GB300 Rubin系列) 国内厂商(长城电子 东微半导体 斯达半导体)[1][3][4][25][38] **核心观点和论据** * 高端AI服务器功率密度极高 英伟达NVL72整机柜功率达132千瓦 采用多组5.5千瓦电源模块[1][3][6] * 未来技术趋势是向更高功率(12千瓦甚至19千瓦)和800伏高压直流(HVDC)架构发展 以提升效率并减少体积[1][5][7] * 为实现更高功率密度和效率 下一代电源将广泛采用碳化硅(SiC)和氮化镓(GaN)等先进半导体材料替代传统硅基器件(如IGBT 超级结MOS)[1][5][6][7][15] * 英伟达下一代Rubin方案将支持800伏HVDC输入 并优化架构[1][7] * 在电力转换架构中 HVDC方案将市电转换为800伏直流再供给PSU 与传统方案(480伏交流输入)在服务器内部最终均转换为48伏直流[8][9] * 切换至氮化镓技术的主要驱动力是解决发热问题 因其具有更高效率和更低热损耗[10] * 碳化硅主要用于高压环节(如12.8千伏变压至800伏 HVDC整流 PSU中800V转48V) 氮化镓主要用于200伏以内的低压应用(如板载电源 桥式整流)[11][13][14] * 成本是技术选型的关键因素 超级结MOS因成本低廉在高压领域(400-600V)仍有强大竞争力 全面替代不经济[2][12][30] * 国内厂商如长城电子已在7.5-8千瓦电源模块中采用氮化镓技术 东微半导体的超级结MOS性能接近英飞凌且价格低30% 有机会进入核心供应链[4][25][41] * 碳化硅和氮化镓器件当前价格:650V SiC约50元/颗 1200V SiC约90元/颗 200V GaN约50-60元/颗[23] * 当前服务器电源市场仍以传统硅基器件(IGBT 超级结MOS SGT MOS)为主 但GaN在PSU中的应用已开始放量 SiC需待HVDC起量[15][26][44] * 英伟达未来两年(至2027年)主力产品(B200 B300)仍将大量使用超级结MOS 不会完全切换至HVDC方案 大规模应用需待Rubin系列[42][43] * 普通服务器电源功率多在300-500瓦(占比65%) 使用传统SGT MOS 高功率AI服务器(如7-8kW)将是GaN的主要应用场景[34][35][37] **其他重要但可能被忽略的内容** * 约25%的AI服务器市场采用由厂商提供壳体、用户自装英伟达GPU(A卡/H卡)的模式 通常需要3000瓦电源[36] * 国内供应商(东微 斯达)目前主要为国内企业(如华为 阳光电源)供货 尚未大规模进入英伟达国际供应链[38][39] * 电源市场对设备可靠性要求极高 价格敏感度低 更注重性能与稳定性[40] * HVDC方案能显著减少碳化硅用量(约2/3)但电压等级提高一倍[22] * 在PSU设计中存在混用碳化硅(第一级降压)和氮化镓(第二级降压)的情况[18][19] * GB200和GB300采用不同的冗余电源配置模式(4+2/4+4 和 5+3)[4][16][17]
银行股突发跳水!
证券时报· 2025-06-27 17:33
市场整体表现 - 沪指午后在银行、保险等板块拖累下快速下探,收盘跌0.7%报3424.23点,深证成指涨0.34%报10378.55点,创业板指涨0.47%报2124.34点,北证50指数涨约1%,上证50指数跌1.13% [1] - 沪深北三市合计成交15759亿元,较此前一日减少476亿元,场内近3400股上涨 [1] 行业板块表现 银行板块 - 银行板块大幅下挫,青岛银行、杭州银行、重庆银行跌超4%,江苏银行、招商银行、中国银行、农业银行等跌逾3% [4] - 银行派息日期提前至4月至6月,投资者可能在获得红利后选择卖出 [6] - 中信证券指出银行资产质量数据平稳,对公贷款不良生成率下降,零售信贷资产质量需重点关注,宏观政策指向降低银行系统性风险的方向,预计2025年行业估值上行 [6] 有色板块 - 有色板块走势强劲,电工合金、中孚实业、北方铜业涨停,锡业股份、江西铜业涨约6%,洛阳钼业涨约5% [8] - 上半年贵金属板块表现突出,黄金价格加速上涨,主要受美元信用体系弱化、美国财政压力上升及地缘政治风险驱动 [11] - 平安证券预计下半年有色金属表现分化,贵金属价格中枢持续抬升,铜铝等工业金属弹性有望加速释放,镍锂等能源金属仍需等待基本面驱动 [11] AI产业链 - 铜缆连接、CPO概念等AI产业链股集体走高,创益通、新亚电子涨停,泓淋电力涨近12%,联特科技涨超17%,华天科技、中京电子涨停,源杰科技、中际旭创涨近7% [13] - AI大模型训练、推理需求旺盛,底层基础设施向更大集群方向发展,系统级节点有望成为AI算力发展重要方向 [15] - 中信证券认为系统级算力有望成为AI发展下一站,国产GPU芯片公司可能通过高资源密度算力基础设施实现追赶 [15] 港股表现 - 百济神州跌约8%,阿里健康涨超6%,小米集团涨逾4%,盘中一度大涨8%续创历史新高 [2]
金融IT重要性凸显!仅靠银行、券商无法达成,还需金融软件提供技术支持!
新浪基金· 2025-06-26 10:23
信创ETF基金表现 - 信创ETF基金(562030)6月26日场内价格上涨1.45%至0.980元,冲击日线4连阳,成交额达2825.53万元,成交量29.09万手 [1][2] - 成份股中格尔软件涨停,恒生电子涨超6%,京北方、海光信息涨逾5%,中科曙光涨超4% [1] - 基金资产净值2.34亿,单位净值0.969元,溢价率-0.17% [2] 行业政策与事件驱动 - 香港证监会批准国泰君安国际控股牌照升级,央行与香港金管局启动"跨境支付通",实现内地与香港支付系统对接 [2] - 政策托底+AI赋能+国产替代构成信创产业"黄金三角",金融、政务领域信创订单进入爆发期 [3] - 数字中国顶层设计加速国产替代进程,信创2.0有望推动科技自主可控 [6] 技术发展与投资逻辑 - AI大模型训练需求推动算力基础设施升级,国产GPU公司有望通过高密度算力产品实现技术追赶 [3] - 中证信创指数覆盖基础硬件、软件等核心环节,具备高成长性,四重投资逻辑包括地缘政治驱动的自主可控、政府采购回暖、国产技术突破及采购标准细化 [5] - 大数据产业ETF(516700)聚焦数据中心、云计算等领域,权重股含中科曙光、浪潮信息等龙头,信创含量近70% [6] 市场观点与建议 - 数字货币与跨境支付需大数据、云计算等技术支持,系统级算力或成AI发展下一站 [3] - 建议关注英伟达系统级产品出货及华为CloudMatrix384等国产化进展 [3] - 核心硬件(服务器/芯片)和场景化软件企业受分析师重点推荐 [3][5]