Workflow
灵衢(UnifiedBus)
icon
搜索文档
“超节点+集群”:华为闯出AI算力自主创新之路
科技日报· 2025-09-29 07:47
算力在数字经济与AI发展中的核心地位 - 算力被视为数字经济时代的发动机和人工智能发展的关键资源 [1] - 截至今年6月底,中国在用算力中心机架总规模达到1085万标准机架,智能算力规模为788 EFlops,位居全球前列 [1] - 迈向通用人工智能和世界模型需要海量算力作为支撑 [1] 华为“超节点+集群”算力解决方案 - 华为提出“超节点+集群”的差异化路径,以突破外部芯片制造工艺限制 [2] - 超节点通过整合算力芯片资源,在单个节点内构建低延迟、高带宽的算力实体,旨在提高算力利用效率以支撑千亿乃至万亿参数模型的训练和推理 [2] - 集群将多个超节点通过高速网络互联,并通过软件层统一调度,实现如云服务般的灵活性 [2] - 华为发布Atlas 950/960 SuperPoD超节点,分别支持8192张和15488张昇腾卡,并推出算力规模分别突破50万卡和达到百万卡的超节点集群 [3] - “超节点+集群”是华为在计算上的核心战略,计划以几乎一年一代、每代算力规模翻倍的速度演进 [3] - 该解决方案旨在为中国人工智能提供可持续、可拓展的算力底座 [3] - 尽管单颗芯片性能及昇腾生态与国际领先者相比仍有差距,但华为对通过计算架构创新满足国内AI算力需求充满信心 [4] 开源开放战略与算力生态建设 - 华为发布并开放超节点互联协议“灵衢2.0”的技术规范,以共建开放生态 [5][6] - 华为已宣布全面开源开放昇腾硬件使能CANN,加速开发者创新 [6] - 开源开放被视为促进硬件规模化使用和生态建设的关键,硬件规模化使用可弥补开源开放的投入 [6][7] - 开放智算生态和开源成标配已成为2025年人工智能产业关键词 [6] - 开源技术有助于降低算力成本,并推动AI开发模式向全系统创新转变 [6] - 中国正通过出台相关政策文件,为开源生态提供政策支持 [7] - 华为认为生态是通过使用发展起来的,需要开发者和合作伙伴共同努力 [7] AI产业的经济前景 - 根据中国电信研究院预测,到2035年,AI将为中国GDP贡献超过11万亿元 [3]
中国AI高速路,华为给出开源开放方案
量子位· 2025-09-23 19:01
超节点技术架构创新 - 华为发布创新的超节点架构,覆盖数据中心到工作站的全场景产品线 [3] - Atlas 950 SuperPoD采用正交架构实现零线缆电互联和液冷接头浮动盲插设计,光模块液冷可靠性提升一倍 [4] - 创新的UB-Mesh递归直连拓扑网络支持8192卡无收敛全互联,以64卡为步长按需扩展 [4] - Atlas 850是业界首个企业级风冷AI超节点服务器,支持多柜灵活部署形成1024卡集群,无需改造现有风冷机房 [8] - Atlas 350标卡采用昇腾950PR芯片使向量算力提升2倍,推荐推理场景性能提升2.5倍 [10] - TaiShan 950 SuperPoD具备百纳秒级超低时延和Tb级超大带宽,提升数据库及大数据场景业务性能 [13] 性能对比优势 - Atlas 950超节点相比英伟达NVL144规模达56.8倍、总算力达6.7倍、内存容量达15倍(1152TB)、互联带宽达62倍(16.3PB/s) [5] - 对标英伟达2027年计划上市的NVL576仍保持领先优势 [6] - Atlas 950 SuperCluster规模达xAI Colossus的2.5倍,算力达1.3倍,成为全球最强算力集群 [48] 开源开放生态战略 - 全面开放超节点技术硬件包括NPU模组、风冷/液冷刀片、AI标卡等基础硬件 [18] - 开放灵衢协议和超节点参考架构,允许产业界基于技术规范自研产品 [17] - 操作系统灵衢组件全部开源并合入openEuler等社区,支持用户自行迭代维护 [20] - 昇腾CANN全面开源开放,Mind系列组件同步开源并支持PyTorch等开源社区 [20] - 通过开源降低适配成本,推动产业协同发展和行业场景化解决方案建设 [22][23] 灵衢协议技术特性 - 灵衢(UnifiedBus)是面向超节点的互联协议,实现资源池化、线性扩展和长稳可靠 [33] - 通过大带宽低时延互联网络统一通信协议,消除协议转换开销并实现全局资源池化 [31] - 解决传统集群规模扩大时效率下降和可靠性难题,使集群像单机一样协同工作 [32] - 协议全面开源支持自由开发系统调度软件,促进生态繁荣 [34][36] 产业应用与生态建设 - 超节点已服务于互联网、金融、运营商、电力、制造等行业 [29] - 构建开放的综合交通枢纽式生态,打破封闭式协议隔阂 [40][42] - 支持不同规模用户搭建AI高速路,实现硬件软件算法共建共赢 [51] - 形成AI时代自主可控的技术基座和标准话语权 [52] - 通过最大市场优势形成创新飞轮效应,类似新能源汽车发展路径 [53]
徐直军:华为对于为人工智能提供充裕算力充满信心
搜狐财经· 2025-09-19 06:16
核心观点 - 公司发布全球最强算力的超节点及集群产品,旨在引领人工智能基础设施新范式 [1] - 公司强调基于中国可获得芯片工艺打造算力解决方案,以满足持续增长的AI算力需求 [3] - 公司将超节点技术引入通用计算领域,并开放互联协议以构建开放生态 [4] 产品发布 - 发布Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192张及15488张昇腾卡 [3] - 超节点产品在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先 [3] - 发布Atlas 950 SuperCluster和Atlas 960 SuperCluster集群,算力规模分别超过50万卡和达到百万卡 [3] - 推出全球首个通用计算超节点TaiShan 950 SuperPoD,结合GaussDB数据库以取代大型机和小型机 [4] 技术突破与生态建设 - 公司突破大规模超节点互联技术挑战,开创面向超节点的互联协议灵衢(UnifiedBus) [4] - 公司将开放灵衢2.0技术规范,邀请产业界伙伴共建开放生态 [4] - 超节点技术使多台机器在逻辑上以一台机器运行,实现统一的学习、思考和推理 [3]
从超节点到集群,华为亮出AI算力全家桶
21世纪经济报道· 2025-09-18 21:17
华为AI算力战略发布 - 公司在全联接大会上公布AI算力全景图 包括4颗昇腾芯片 3个超节点 2款鲲鹏CPU和灵衢互联架构 全面对标英伟达 [1] - 公司强调基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 以满足持续增长的算力需求 [1][8] - 这是时隔6年后再次集中展示芯片进展 明年大会可能更名为华为计算联接大会 体现对AI算力的重视 [1] 昇腾芯片技术路线 - 昇腾芯片未来三年迭代路线明确:2026年Q1推出Ascend 950系列 2027年Ascend 960 2028年Ascend 970 实现一年一代算力翻倍 [3] - Ascend 950PR面向推理Prefill阶段和推荐场景 新增支持FP8/MXFP578/MXFP4低精度数据格式提升训练效率 [3] - Ascend 950DT更注重推理Decode阶段和训练场景 与950PR形成互补 [3] - 昇腾芯片从2019年昇腾910上市至今已从加速卡演进为完整AI软硬件体系 [4][5] 鲲鹏CPU发展规划 - 鲲鹏950预计2026年Q4推出 鲲鹏960预计2028年Q1推出 [5] - 鲲鹏直接对标英特尔和AMD产品 在超节点中与昇腾芯片形成合力 [5] - 公司围绕鲲鹏和昇腾构建新计算生态 为核心AI算力旗舰产品 [5] 超节点技术突破 - 发布Atlas 950 SuperPoD支持8192张昇腾卡 Atlas 960 SuperPoD支持15488张昇腾卡 在卡规模/总算力/内存容量/互联带宽等关键指标全面领先 [6] - 基于超节点发布全球最强集群Atlas 950 SuperCluster算力超50万卡 Atlas 960 SuperCluster算力达百万卡 [6] - CloudMatrix 384超节点累计部署300多套服务20多家客户 Atlas 950 SuperPoD预计今年Q4上市 Atlas 960 SuperPoD预计2027年Q4上市 [6] 通用计算与互联技术 - 率先将超节点技术引入通用计算领域 发布全球首个通用计算超节点TaiShan 950 SuperPoD 结合GaussDB可取代大型机/小型机及Exadata数据库一体机 [7] - 突破大规模超节点互联技术挑战 开创灵衢(UnifiedBus)互联协议 将开放灵衢2.0技术规范共建开放生态 [7] - 灵衢UB是目前唯二商用的高速互联总线超节点架构产品 可与英伟达NVLink直接竞争 [7] 算力发展战略 - 公司通过架构性创新开创自主可持续计算产业发展道路 强调系统算力而非单处理器算力 [8] - 在系统工程层面通过超节点系统有效调度 昇�系统能效可比肩英伟达 [9] - 中国AI市场多厂商竞争格局形成 包括华为昇腾/阿里平头哥/百度昆仑/寒武纪等均在追赶英伟达 [5]
华为发布算力超节点和集群
人民网· 2025-09-18 20:39
核心观点 - 华为发布算力超节点和集群产品 旨在通过超节点互联技术引领AI基础设施新范式 满足持续增长的算力需求 [1][2][3] 产品发布 - 推出Atlas 950 SuperPoD超节点支持8192张昇腾卡 Atlas 960 SuperPoD超节点支持15488张昇腾卡 在卡规模/总算力/内存容量/互联带宽等关键指标全面领先 [2] - 基于超节点发布Atlas 950 SuperCluster集群算力规模超50万卡 Atlas 960 SuperCluster集群算力规模达百万卡 [2] - 将超节点技术引入通用计算领域 发布TaiShan 950 SuperPoD通用计算超节点 结合GaussDB分布式数据库可取代大型机/小型机及Exadata数据库一体机 [2] 技术突破 - 通过系统性创新突破大规模超节点互联技术挑战 开创面向超节点的互联协议灵衢(UnifiedBus) [3] - 开放灵衢2.0技术规范 邀请产业界伙伴基于灵衢研发相关产品和部件 共建开放生态 [3] 战略定位 - 基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 为人工智能长期快速发展提供可持续且充裕算力 [2] - 通过超节点互联技术引领AI基础设施新范式 推动人工智能持续发展创造更大价值 [3]
打造全球最强算力 华为徐直军时隔六年再谈芯片进展
第一财经· 2025-09-18 16:51
自研芯片规划 - 公司规划未来三年推出多款昇腾芯片包括950PR 950DT 960和970 其中950PR芯片将于2026年第一季度推出并采用自研HBM技术 [1] 超节点部署与战略 - 公司Cloud Matrix 384超节点累计部署超过300套 超节点成为AI基础设施建设新常态 [3] - 公司基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案以满足持续增长的算力需求 [3] - 超节点在物理上由多台机器组成但逻辑上以一台机器学习思考推理 [3] 新产品发布 - 公司发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张和15488张昇腾卡 关键指标全球领先 [5] - 公司发布Atlas950 SuperCluster和Atlas960 SuperCluster超节点集群 算力规模分别超过50万卡和达到百万卡 [5] - 公司将超节点技术引入通用计算领域 发布全球首个通用计算超节点TaiShan 950SuperPoD [5] - 结合GaussDB分布式数据库 新产品能彻底取代大型机小型机及Exadata数据库一体机 [5] 技术突破与开放 - 公司突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus) 并计划开放灵衢2.0技术规范 [5] - 公司通过联接技术突破实现万卡级超节点 弥补单颗芯片算力差距 构建全球最强算力 [6] 行业定位与愿景 - 算力是人工智能的关键 更是中国人工智能的关键 [3] - 公司对为人工智能长期快速发展提供可持续充裕算力充满信心 [5] - 公司愿与产业界共同努力构筑支撑中国乃至全世界AI算力需求的坚实底座 [6]
华为徐直军时隔六年再谈芯片进展
第一财经资讯· 2025-09-18 13:56
自研芯片规划 - 公司规划未来三年推出多款昇腾芯片包括950PR 950DT以及昇腾960和970 其中950PR芯片将于2026年第一季度推出并采用自研HBM技术 [2] 算力基础设施布局 - 超节点成为AI基础设施建设新常态 Cloud Matrix 384超节点累计部署300套以上 [4] - 公司发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张及15488张昇腾卡 关键指标全球领先 [7] - 公司发布超节点集群Atlas950 SuperCluster和Atlas960 SuperCluster 算力规模分别超过50万卡和达到百万卡 [7] - 公司推出全球首个通用计算超节点TaiShan 950SuperPoD 结合GaussDB分布式数据库可取代大型机和小型机 [8] 技术突破与开放策略 - 公司突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus)并计划开放灵衢2.0技术规范 [8] - 尽管单颗芯片算力受制裁影响存在差距 但通过联接技术突破实现万卡级超节点构建全球最强算力 [8] 战略定位 - 算力是人工智能及中国人工智能发展的关键要素 [4] - 公司基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案以满足持续增长的算力需求 [4] - 超节点在物理上由多台机器组成但逻辑上以单台机器运作 [5] - 公司对为人工智能长期快速发展提供可持续充裕算力充满信心 [8] - 公司愿与产业界共同构筑支撑中国及全球AI算力需求的坚实底座 [8]
华为徐直军时隔六年再谈芯片进展
第一财经· 2025-09-18 13:50
芯片研发进展 - 未来三年规划多款昇腾芯片包括950PR、950DT、960和970 其中950PR将于2026年第一季度推出并采用自研HBM技术 [3] 算力基础设施 - 超节点成为AI基础设施建设新常态 Cloud Matrix 384超节点累计部署超过300套 [5] - 发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张和15488张昇腾卡 关键指标全球领先 [7] - 发布超节点集群Atlas950 SuperCluster和Atlas960 SuperCluster 算力规模分别超过50万卡和达到百万卡级 [7] - 推出全球首个通用计算超节点TaiShan 950SuperPoD 结合GaussDB可取代大型机和小型机 [7] 互联技术突破 - 突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus) 未来将开放灵衢2.0技术规范 [7] - 通过联接技术突破实现万卡级超节点 弥补单芯片算力差距 构建全球最强算力系统 [8] 战略定位 - 基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 满足持续增长的算力需求 [5] - 致力于为人工智能长期快速发展提供可持续且充裕算力 构筑支撑中国及全球AI算力需求的坚实底座 [7][8]
华为徐直军谈芯片三年规划,努力打造“超节点+集群”解决方案
第一财经· 2025-09-18 12:45
芯片产品规划 - 公司规划未来三年推出多款昇腾芯片包括950PR 950DT 960和970 其中950PR芯片将于2026年第一季度推出并采用自研HBM技术 [1] - 公司发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张和15488张昇腾卡 在卡规模总算力内存容量及互联带宽等关键指标处于全球领先位置 [5] - 公司发布超节点集群Atlas950 SuperCluster和Atlas960 SuperCluster 算力规模分别超过50万卡和达到百万卡级别 [5] 技术突破与创新 - 公司突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus)并计划未来开放灵衢2.0技术规范 [6] - 公司率先将超节点技术引入通用计算领域 发布全球首个通用计算超节点TaiShan 950SuperPoD 结合GaussDB分布式数据库可取代大型机小型机及Exadata数据库一体机 [6] - 超节点在物理上由多台机器组成 但逻辑上以单台机器学习思考推理 目前Cloud Matrix 384超节点累计部署300套以上 [3] 战略定位与行业影响 - 公司基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 以满足持续增长的算力需求 [3] - 公司通过联接技术突破实现万卡级超节点 弥补单颗芯片算力差距 构建全球最强算力基础设施 [6] - 算力被定义为人工智能及中国人工智能发展的关键要素 公司对提供可持续且充裕的AI算力充满信心 [1][3][6]
华为算力全面出击:昇腾950明年上市 徐直军称超节点超英伟达
21世纪经济报道· 2025-09-18 12:36
公司战略与产品布局 - 华为公布AI算力全景图 全面对标英伟达 实现AI算力全栈技术自研[1] - 昇腾芯片规划至2028年 包括2026Q1推出950PR芯片 2026Q4推出950DT芯片 2027Q4推出960芯片 2028Q4推出970芯片[1] - 鲲鹏CPU新规划包括2026Q4推出950型号 2028Q1推出960型号[3] - 开放灵衢2.0互联技术规范 构建开放生态[4] 算力产品技术突破 - 推出Atlas 950 SuperPoD超节点支持8192张昇腾卡 Atlas 960 SuperPoD支持15488张昇腾卡 关键指标全面领先[1] - 基于超节点构建全球最强集群 Atlas 950 SuperCluster算力超50万卡 Atlas 960 SuperCluster达百万卡规模[2] - 灵衢互联协议突破大规模超节点互联技术挑战[4] - 将超节点技术引入通用计算领域 推出TaiShan 950 SuperPoD 结合GaussDB可取代大型机/小型机及Exadata一体机[2] 市场进展与产能规划 - CloudMatrix 384超节点累计部署300多套 服务20多家客户[2] - Atlas 950 SuperPoD计划2023年四季度上市 Atlas 960 SuperPoD计划2027年四季度上市[2] - 基于中国芯片制造工艺打造超节点+集群算力解决方案[1]