Workflow
Atlas 950 SuperCluster
icon
搜索文档
华为超节点赶超英伟达:驾驭“光”很关键
观察者网· 2026-02-10 11:20
行业背景与需求 - 当前算力需求远未被满足,大模型进入生产系统及消费端导致token消耗量呈指数级增长,未来中国每日token消耗量可能突破千万亿 [3] - 简单堆砌服务器和芯片无法有效解决算力缺口,根据Meta论文,万卡集群训练时算力利用率仅约38%,存在高达62%的算力浪费,且模型训练每3小时中断一次 [3] - 集群网络通信已成为大模型训练和推理的主要挑战,计算单元间通信不畅会导致NPU闲置,造成效率低下,出现1+1<2的结果 [3] 超节点的定义与核心特点 - 超节点是对传统计算架构的重构,从以CPU为中心转变为全平等互联架构,CPU、NPU和内存单元无需经过CPU即可直接互联,提升了通信效率 [4] - 真正的超节点需具备三大关键特点:足够大的带宽以确保计算不等待通信、足够低的时延、形成逻辑上的单一系统,其核心在于内存的统一编址 [6] - 统一内存编址技术是实现超节点的关键,它使内存能够池化,从而实现计算单元间的数据快速交换,提升计算效率 [6] 超节点的性能优势 - 超节点相比传统集群的最大优势是显著提升计算效率,可将模型算力利用率从30%提升至45%,相当于性能提升50% [7] - 在摩尔定律放缓、芯片制程从7纳米到3纳米每代性能提升不超过20%的背景下,超节点通过高效资源调度,能在一定程度上弥补芯片工艺的代差 [7] 华为超节点的技术实现与创新 - 华为昇腾384超节点由12个计算柜和4个总线柜构成,其核心创新在于采用光通信技术实现超高速互联,突破了电信号传输距离(通常2-5米)的限制,从而能够规模商用384颗芯片互联,并未来支持8192颗芯片互联 [8] - 光模块技术面临成本高、对环境敏感(如灰尘、温度变化易导致闪断)等挑战,实现如电一般可靠、如光一般长距离传输难度很大 [8] - 华为凭借系统化创新实现了全光互联超节点,其能力源于自研芯片、光器件、底层协议以及在光通信领域超过20年的全球领先技术积累 [9] - 华为构建了新型互联协议“灵衢UB”(UnifiedBus),并将灵衢2.0规范开放,其基础协议长达600页,是业界最详细完整的协议,旨在与产业界共创繁荣生态 [11][12] 华为超节点的产品布局 - 华为不仅在发展智算超节点(如昇腾384),也在发展通算超节点,例如基于鲲鹏950处理器的TaiShan 950超节点,这是全球首个通用计算超节点,计划于2026年一季度上市 [9] - TaiShan 950超节点结合分布式GaussDB数据库,旨在取代各种应用场景的大型机、小型机以及Oracle的Exadata数据库服务器 [9] - 无论是智算还是通算超节点,其核心目标都是让大量服务器像一台计算机一样工作,提供超大带宽、超低时延和统一内存编址能力 [11] 软件生态与产业共建 - 支撑超节点运行的不仅有硬件,还包括大量软件生态,如异构计算架构CANN、操作系统openEuler、数据库openGauss、AI框架MindSpore等 [14] - 华为坚持软件开源开放,截至2025年8月,鲲鹏注册开发者达380万,昇腾开发者近400万,并将CANN从底层运行时到开发语言、算子库等完整开源 [14] - openEuler是业界首个面向超节点的开源操作系统,华为通过开放核心技术与产业协同共创,以应对AI时代快速迭代的挑战 [14]
华为打造“最强超节点”,这项全球领先技术很关键
观察者网· 2026-02-10 11:10
文章核心观点 - 超节点是AI算力基础设施的重要革新,其核心价值在于通过重构计算架构(如全平等互联、统一内存编址)来显著提升算力利用率,而非简单的硬件堆砌 [1][4][7] - 华为凭借在光通信等领域的系统化创新能力,实现了大规模芯片(如384颗昇腾芯片)的高效互联,并计划将技术开放以构建产业生态 [8][9][11][12] - 算力需求(如中国每日token消耗量可能突破千万亿)正指数级增长,但传统集群存在严重效率问题(如万卡集群算力利用率仅约38%),这凸显了超节点技术的必要性 [3][7] 行业背景与需求 - AI算力需求远未被满足,大模型在生产系统和消费端的token消耗量正指数级增长,未来中国每日token消耗量可能突破千万亿 [3] - 传统通过大量建设服务器集群“堆卡”的方式存在巨大效率瓶颈,例如Meta论文指出万卡集群训练时算力利用率仅约38%,会造成62%的算力浪费,且模型训练每3小时中断一次 [3] - 集群网络通信已成为大模型训练和推理的最大挑战,以混合专家模型(MoE)为例,计算单元间通信不畅会导致NPU闲置,造成1+1<2的效率损失 [3] 超节点的技术定义与优势 - 超节点是对传统以CPU为中心的计算架构的重构,变为全平等互联架构,CPU、NPU、内存单元无需经过CPU即可直接互联,提高了通信效率 [4] - 真正的超节点须具备三个关键特点:足够大的带宽(让计算不等待通信)、足够低的时延、形成逻辑上的单一系统(关键在于内存统一编址) [6] - 统一内存编址技术是实现超节点的核心,它使内存能够池化,实现计算单元间的数据快速交换,类似于图书馆的书籍编址检索,与传统集群“寄快递”式的信息传递方式有本质区别 [6] - 超节点能显著提升计算效率,可将模型算力利用率从30%提升到45%,相当于提升50%,这在一定程度上可以弥补芯片工艺代差(如7纳米到3纳米每代性能提升不超过20%)带来的挑战 [7] 华为超节点的技术实现与创新 - 华为昇腾384超节点由12个计算柜和4个总线柜构成,其大规模互联(384颗芯片)的核心在于采用了光通信技术,而非业界常见的全铜线电信号架构 [8] - 电信号传输距离受限(通常只能在一个机柜内传送2到5米),而光通信技术使华为能够跳出单个机柜限制,实现384颗芯片互联,并计划未来支持8192颗芯片互联 [8] - 光模块技术挑战大,存在成本高、对环境敏感(灰尘、温度变化易导致闪断)等问题,华为凭借在光通信领域过去20年全球第一的技术积累和系统化创新能力(自研芯片、光器件、底层协议),实现了可靠的全光互联超节点 [8][9] - 华为构建了新型互联协议“灵衢UB(UnifiedBus)”,并将其灵衢2.0规范(基础协议达600页)完全开放,旨在让产业界伙伴能借此技术打造自己的超节点,共创繁荣生态 [11][12] 产品布局与生态建设 - 华为不仅在发展智算超节点(如昇腾系列),也在发展通算超节点,例如基于鲲鹏950处理器的TaiShan 950超节点,这是全球首个通用计算超节点,计划在2026年一季度上市 [9] - TaiShan 950超节点结合分布式GaussDB数据库,旨在取代各种应用场景的大型机、小型机以及Oracle的Exadata数据库服务器 [9] - 华为坚持软件开源开放以共建生态,其鲲鹏有380万注册开发者,昇腾有近400万开发者,并于2025年8月将异构计算架构CANN完全开源,openEuler是业界首个面向超节点的开源操作系统 [14] - 开放软件栈(包括CANN、openEuler、openGauss、MindSpore)旨在让开发者能基于此进行业务创新,华为认为AI时代需协同共创、开放共生 [14]
“超节点+集群”:华为闯出AI算力自主创新之路
科技日报· 2025-09-29 07:47
算力在数字经济与AI发展中的核心地位 - 算力被视为数字经济时代的发动机和人工智能发展的关键资源 [1] - 截至今年6月底,中国在用算力中心机架总规模达到1085万标准机架,智能算力规模为788 EFlops,位居全球前列 [1] - 迈向通用人工智能和世界模型需要海量算力作为支撑 [1] 华为“超节点+集群”算力解决方案 - 华为提出“超节点+集群”的差异化路径,以突破外部芯片制造工艺限制 [2] - 超节点通过整合算力芯片资源,在单个节点内构建低延迟、高带宽的算力实体,旨在提高算力利用效率以支撑千亿乃至万亿参数模型的训练和推理 [2] - 集群将多个超节点通过高速网络互联,并通过软件层统一调度,实现如云服务般的灵活性 [2] - 华为发布Atlas 950/960 SuperPoD超节点,分别支持8192张和15488张昇腾卡,并推出算力规模分别突破50万卡和达到百万卡的超节点集群 [3] - “超节点+集群”是华为在计算上的核心战略,计划以几乎一年一代、每代算力规模翻倍的速度演进 [3] - 该解决方案旨在为中国人工智能提供可持续、可拓展的算力底座 [3] - 尽管单颗芯片性能及昇腾生态与国际领先者相比仍有差距,但华为对通过计算架构创新满足国内AI算力需求充满信心 [4] 开源开放战略与算力生态建设 - 华为发布并开放超节点互联协议“灵衢2.0”的技术规范,以共建开放生态 [5][6] - 华为已宣布全面开源开放昇腾硬件使能CANN,加速开发者创新 [6] - 开源开放被视为促进硬件规模化使用和生态建设的关键,硬件规模化使用可弥补开源开放的投入 [6][7] - 开放智算生态和开源成标配已成为2025年人工智能产业关键词 [6] - 开源技术有助于降低算力成本,并推动AI开发模式向全系统创新转变 [6] - 中国正通过出台相关政策文件,为开源生态提供政策支持 [7] - 华为认为生态是通过使用发展起来的,需要开发者和合作伙伴共同努力 [7] AI产业的经济前景 - 根据中国电信研究院预测,到2035年,AI将为中国GDP贡献超过11万亿元 [3]
冲破AI算力瓶颈,华为开辟出一条“新中式”路径
经济观察报· 2025-09-26 18:09
全球AI产业格局重塑 - 英伟达以50亿美元入股英特尔,OpenAI与甲骨文敲定三千亿美元算力订单,美国AI产业链加速构建“芯片-算力-模型-应用”闭环 [2] - 全球AI产业正迎来一场以生态整合为核心的格局重塑,资本与技术通过垂直整合筑牢竞争壁垒 [2] 华为算力战略发布 - 华为发布全球最强算力超节点和集群,涵盖四颗昇腾芯片、三个超节点、两个集群及灵衢互联架构,展示全栈AI算力技术能力 [4] - 此次发布被视为昇腾在经历多年制裁后的高调“回归”,标志着战略决心的展现 [4] 非对称竞争路径 - 华为通过系统工程和联接技术优势弥补单颗芯片性能短板,开辟通往世界级AI算力的非对称竞争路径 [5] - 公司战略从追逐“单芯片性能”转向追求“系统性能”领先,改变游戏规则本身 [5] 算力的战略重要性 - 算力被定义为AI时代核心基础设施和新质生产力,是支撑数字经济增长和产业转型升级的基石 [6] - 对智能算力的需求呈指数级增长,其增速远超通用算力,成为国家数字经济发展水平的核心指标 [6] 华为面临的挑战与应对 - 华为因美国制裁无法在台积电投片,单颗芯片算力与英伟达存在差距,曾对昇腾910芯片进行配给销售 [6] - 公司强调算力是人工智能的关键,尤其对中国人工智能发展至关重要,与国家建设国产算力基础设施战略高度契合 [7] 系统性能新范式 - 华为提出以系统工程能力制胜的新架构,用更高效联接更多芯片的方式实现整体性能超越,即“用非摩尔补摩尔、用数学补物理” [8] - 竞争焦点从单个处理器峰值速度转向成千上万处理器间的数据通信效率,将优化重心从“神经元”转移到“神经网络” [8] 超节点与集群硬件产品 - Atlas 950 SuperPoD超节点支持8192张昇腾卡,Atlas 960 SuperPoD超节点支持15488张昇腾卡,逻辑上像一台计算机一样工作 [9] - Atlas 950 SuperCluster集群算力规模超50万卡,Atlas 960 SuperCluster集群达百万卡规模,创造高度内聚、极低延迟的计算环境 [11] 昇腾生态建设策略 - 华为商业模式为通过开源开放软件层和互联规范降低开发者门槛,依靠昇腾硬件变现,旨在形成飞轮效应 [12] - 生态推广主要障碍是开发者对英伟达工具链的使用惯性,公司呼吁国内产业界形成合力共同培育自主AI生态系统 [12] 能源与政策支持 - 中国“东数西算”工程利用西部廉价清洁能源和凉爽气候为数据中心提供稳定低成本电力,保障算力战略经济可行性 [13] - 企业技术战略与国家产业政策深度耦合,为超节点+集群战略提供坚实保障 [13] 华为战略演进 - 华为全联接大会主题从“塑造云时代”到“跃升行业智能化”,战略焦点从宏观数字化转型彻底转向重构AI底层算力基础设施 [14][15] - 2025年大会焦点直指算力基础设施本身,旨在为AI应用层“百花齐放”提供肥沃土壤,突破算力瓶颈与生态短板 [16] 全球市场潜在影响 - 华为算力长征战略若成功,全球AI基础设施市场可能形成英伟达/CUDA与华为/昇腾两极分化的生态系统 [16] - 这将挑战AI开发领域长期由单一技术标准主导的格局,为全球技术版图带来新变量 [16]
冲破AI算力瓶颈,华为开辟出一条“新中式”路径
经济观察报· 2025-09-26 17:53
全球AI产业格局重塑 - 美国AI产业链通过资本与技术加速垂直整合,构建“芯片-算力-模型-应用”闭环,例如英伟达以50亿美元入股英特尔,OpenAI与甲骨文敲定三千亿美元算力订单[2] - 全球AI产业正迎来以生态整合为核心的格局重塑,旨在通过垂直整合筑牢竞争壁垒[2] 华为AI算力战略与产品发布 - 华为在上海全联接大会2025上正式发布全球最强算力超节点和集群,被视为昇腾在制裁后高调“回归”的标志[3][5] - 公司一次性发布四颗昇腾芯片、三个超节点、两个集群、一个通用计算超节点及灵衢互联架构,展示业界少有的AI算力全栈技术能力[5] - 华为的战略意图是通过系统工程和联接技术优势弥补单芯片性能短板,从追逐“单芯片性能”转向引领“系统性能”竞争[1][7] 算力的战略重要性与中国面临的挑战 - 算力被定义为AI时代核心基础设施和新质生产力,智能算力需求呈指数级增长,是衡量国家数字经济发展水平的核心指标[9] - 中国面临严峻结构性挑战,因美国制裁无法使用台积电先进制程,导致华为单颗芯片算力与英伟达存在差距[9] - 在制裁初期,华为曾对昇腾910芯片进行配给,仅卖给国计民生领域客户,反映出底层硬件供应对中国AI产业发展的制约[9] 华为的非对称竞争技术路径 - 公司提出通过系统工程能力制胜的新架构,利用三十多年联接技术积累,以高效联接更多芯片来弥补单芯片性能差距,实现系统性能超越[12] - 具体硬件产品包括Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192张和15488张昇腾卡,逻辑上像一台计算机一样工作[13] - 超节点可组合成更大规模集群,如Atlas 960 SuperCluster集群算力规模可达百万卡,创造高度内聚、极低延迟的计算环境[15] 昇腾生态建设战略 - 华为确立“硬件变现、软件开源”的商业模式,通过开源昇腾硬件使能CANN、Mind系列套件及灵衢2.0互联规范,降低开发者门槛以培育生态[17] - 生态推广面临开发者对英伟达工具链的使用惯性挑战,公司呼吁国内产业界共同承担早期迁移阵痛,通过使用来解决问题[18] - 国内“东数西算”工程利用西部廉价清洁能源和凉爽气候,为大规模算力集群提供稳定低成本电力,保障战略经济可行性[18] 华为战略演进与长远目标 - 公司全联接大会主题从“塑造云时代”演进至“跃升行业智能化”,战略焦点从应用赋能彻底转向重构AI底层算力基础设施[20] - 长远目标是构筑支撑中国乃至全球AI算力需求的坚实底座,突破算力瓶颈,为AI应用层百花齐放提供土壤[21] - 若战略成功,全球AI基础设施市场可能形成英伟达/CUDA与华为/昇腾两极分化的格局,挑战单一技术标准主导现状[21]
果然财经|华为万卡超节点破局,中国芯片从卡脖子到集群算力突围
齐鲁晚报· 2025-09-22 22:40
华为昇腾AI芯片技术突破与路线图 - 公司首次公布昇腾AI芯片完整发展路线图,通过超节点架构与自研灵衢互联协议实现系统级创新,构建自主可控算力底座 [2] - 灵衢互联协议解决超节点互联难题,实现“万卡超节点,一台计算机”,光互联可靠性提升100倍、距离超200米,实现TB级带宽与2.1微秒时延 [3] - 昇腾芯片路线图:2026年Q1推出昇腾950PR,2026年Q4推出昇腾950DT(架构转向SIMD/SIMT),2027年Q4推出规格翻倍的昇腾960,2028年Q4推出昇腾970(FP4/FP8算力及互联带宽全面翻倍,内存访问带宽提升至少1.5倍) [4] - 发布Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡 Atlas 950 SuperPoD对比英伟达NVL144S,卡规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,互联带宽是其62倍 [4] - 发布全球最强超节点集群Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力规模分别超过50万卡和达到百万卡 [4] - 加码软件与生态开放,开源CANN编译器及虚拟指令集接口,计划2025年12月31日前开源Mind系列应用使能套件、工具链及openPangu基础大模型,同时开放灵衢2.0技术规范 [5] 其他科技巨头AI芯片生态布局 - 阿里巴巴布局多元,自研AI推理芯片性能媲美英伟达H20,倚天710服务器CPU证明ARM架构在数据中心可行性,玄铁系列RISC-V芯片持续发展 [8] - 百度昆仑芯系列取得市场成绩,昆仑芯P800用于文心大模型训练,2025年中标中国移动十亿元级订单 [8] - 腾讯通过腾讯云适配国产芯片推动软硬件协同优化,并通过投资布局AI芯片公司及发展异构计算平台 [8] - 字节跳动主要通过投资和供应链合作参与AI芯片领域,计划大幅采购华为昇腾、寒武纪等国产AI芯片 [8] - 国产AI芯片企业沐曦科技、天数智芯、燧原科技和壁仞科技在2025年世界人工智能大会集体亮相,形成多元化合力 [9] 政策支持与专利布局 - 国家层面出台《新时期促进集成电路产业和软件产业高质量发展的若干政策》,目标到2025年将芯片自给率提升至70%,对线宽小于28纳米且经营期15年以上企业实施“十年免税期” [10] - 地方层面提供强力补贴,如北京海淀区流片补贴最高1500万元,重庆高新区单项最高奖励5000万元,杭州萧山区项目最高补助1亿元,广州开发区流片补助最高500万元 [11] - 华为全球有效授权专利数量突破15万件,AI芯片与通信领域重点专利积累超2万件,昇腾产业生态核心企业发明专利占比超80% [11] - 中芯国际累计获得授权专利14215件(发明专利占比超86%),其联合攻关的国产DUV光刻机通过多重曝光技术实现5nm工艺试产验证,为国产芯片提供非美线量产能力 [12] - 专利布局贯穿“设计-生态-制造”全链条,推动国产芯片产业链从单点突破迈向系统能力提升 [12]
计算机行业周报:华为超节点新品正式发布,阿里云栖大会召开在即-20250922
华龙证券· 2025-09-22 19:05
行业投资评级 - 维持计算机行业"推荐"评级 [2][20] 核心观点 - 中美AI竞争正从"单卡性能"转向"系统级效率" 中国通过集群建设+开源生态+工程化交付实现AI基建弯道超车 [20] - 华为超节点技术用工程系统化弥补国产卡单芯片性能不足 实现从可用到好用的跨越 [17] - 阿里巴巴"云+AI"成为接替电商的第二增长曲线 AI基础设施+大模型+应用格局筑牢竞争壁垒 [19] 华为全联接大会成果 - 发布Atlas 950 SuperPoD超节点 支持8192张昇腾卡 预计2026年四季度上市 [4][13] - 发布Atlas 960 SuperPoD超节点 支持15488张昇腾卡 预计2027年四季度上市 [4][14] - 基于超节点构建Atlas 950 SuperCluster集群 算力规模超50万卡 [4][12] - 基于超节点构建Atlas 960 SuperCluster集群 算力规模达百万卡 [4][12] - Atlas 950超节点相比英伟达NVL144:卡规模达56.8倍 总算力达6.7倍 内存容量达15倍 互联带宽达62倍 [4][14] - Atlas 960超节点相比Atlas 950:总算力/内存容量/互联带宽再翻倍 训练性能提升3倍 推理性能提升4倍 [4][14] 阿里巴巴云栖大会前瞻 - 大会将于2025年9月24-25日召开 聚焦AI基础设施建设和AI应用方向 [4][18] - 主要议题包括:超节点Scale Up互连UALink技术/企业级Agent构建/AI Coding/AI+医疗 [4][18] - FY2026Q1云智能集团收入同比增长26% AI相关产品收入连续八个季度三位数增长 [4][18] - 当期资本性支出386.76亿元人民币 同比增长220% [4][18] - 维持未来三年投入3800亿元建设云和AI硬件基础设施目标 [4][18] 投资建议标的 - AI基建领域关注:中科曙光/神州数码/浪潮信息/首都在线/软通动力/优刻得-W [5][20] - 阿里持股/合作伙伴关注:数据港/润建股份/恒生电子/金桥信息/税友股份/亚信安全/用友网络/石基信息 [5][20] 行业动态 - 河南省出台人工智能赋能新型工业化行动方案 目标2027年AI产业规模突破1600亿元 [11] - 恒为科技拟收购上海数珩信息科技75%股份 [11] - 索辰科技全资子公司拟收购北京力控元通科技51%股权 [11] - 东软集团获56亿元智能座舱域控制器定点 [11] 市场表现 - 申万计算机指数周下跌0.16% [7] - 涨幅前五:卡莱特/信息发展/有棵树/安联锐视/开普云 [7][9] - 跌幅前五:*ST东通/新炬网络/*ST云创/纬德信息/博睿数据 [7][9]
科创50ETF上大涨4%,芯原股份、海光信息、晶晨股份涨超10%
每日经济新闻· 2025-09-22 14:30
科创50ETF市场表现 - 午后开盘大幅拉升 上涨4.05% [1] - 单日成交额超40亿元 [1] - 持仓股票芯原股份、海光信息、晶晨股份涨超10% [1] 华为昇腾技术发展路线 - 2026年Q1计划推出950PR芯片 [1] - 2026年Q4计划推出950DT芯片 [1] - 2027年Q4计划推出960芯片 [1] - 2028年Q4计划推出970芯片 [1] - 开发Atlas 950 SuperCluster支持8192卡超节点 [1] - 开发Atlas 960 SuperCluster支持15488卡超节点 [1] 科创50指数行业构成 - 电子行业持仓占比68.77% [1] - 医药生物行业持仓占比9.85% [1] - 两大核心行业合计占比78.62% [1] - 覆盖半导体、医疗器械、软件开发、光伏设备等硬科技领域 [1] 指数投资价值定位 - 当前指数位置接近基点 [1] - 参照创业板历史走势具备成长空间 [1] - 与国产芯片、人工智能、机器人产业发展方向高度契合 [1] 相关金融产品 - 科创50ETF(代码:588000)为追踪标的 [2]
华为“沉默”6年辟出一条算力路 手机领先赋能造车探索技术变现
新浪财经· 2025-09-22 12:39
算力技术突破 - 公司发布全球最强算力超节点Atlas 900 最大算力达300 PFLOPS [5] - 推出Atlas 950/960 SuperPoD超节点 分别支持8192及15488个昇腾计算单元联接 [5] - 基于超节点构建Atlas 950/960 SuperCluster集群 算力规模超50万卡/达百万卡 为全球最强算力集群 [5] - 公司Ascend芯片规划三个系列 包括950/960/970系列 具体芯片持续开发中 [4] - Atlas 950超节点算卡规模达英伟达NVL144的56.8倍 总算力为其6.7倍 [5] 市场表现与业务进展 - 2025年第二季度手机出货量1250万台 以18.1%市场份额重返中国市场榜首 [1][11] - 2025年上半年手机出货量2540万台 市场份额18.1% 稳居国内第一 [11] - 鸿蒙智行全系累计交付突破90万辆(截至8月) 后更新至93万辆(截至9月16日) [1][11] - 与广汽联合打造新品牌"启境" 拓展智能汽车业务布局 [1][11] 研发与技术积累 - 近10年研发投入累计约1.25万亿元 超半数员工从事研发工作 [12] - 截至2024年底全球累计持有有效授权专利超15万件 [12] - 通过持续技术创新实现算力领域曲线突围 历时6年形成独特技术路径 [1][7]
华为超节点:用「一台机器」的逻辑,驱动AI万卡集群
机器之心· 2025-09-19 21:23
超节点架构创新 - 华为基于自研灵衢互联协议创新超节点架构 重新定义大规模有效算力新范式[3][12] - 超节点通过多机物理组合实现逻辑单一设备 统一通信协议与内存编址实现全局资源池化[9] - 架构将通信时延降至百纳秒级 解决传统集群因带宽不足和时延大导致的算力利用率下降问题[5][11] 技术突破与性能表现 - 超节点采用UB-Mesh递归直连拓扑 支持8192卡无收敛全互联 总互联带宽达16PB/s(超全球互联网峰值带宽10倍)[20] - FP8算力达8E FLOPS 支持百万卡规模集群 成为全球最强算力集群之一[20] - 在万亿模型训练中减少40%通信等待时间 显著提升集群利用率和系统可靠性[5][11] 产品矩阵覆盖全场景 - Atlas 950/960 SuperPoD支持8192/15488张昇腾卡 采用全液冷和零线缆电互联设计 解决高密度散热和跨柜部署难题[17][19] - Atlas 850为业界首款企业级风冷超节点服务器 支持1024卡集群 降低企业部署门槛[21] - Atlas 350标卡通过4个灵衢端口实现多卡互联 推荐推理性能提升2.5倍[24] - TaiShan 950 SuperPoD将超节点扩展至通用计算领域 支持数据库和大数据等低延迟场景[25] 生态战略与落地进展 - 推行硬件开放与软件开源战略 将NPU模组和昇腾CANN等核心组件开源[27][28] - 基于灵衢的Atlas 900 A3超节点已累计部署300多套 服务20余个行业客户[28] - 生态覆盖互联网、金融、运营商、电力及制造等多行业[28]