Atlas 950 SuperCluster集群
搜索文档
华为一口气发布多款芯片
半导体行业观察· 2025-09-19 09:29
昇腾AI芯片路线图 - 重申四大战略方向:坚持昇腾硬件变现、CANN编译器及虚拟指令集接口开放(其他软件全开源)、Mind系列应用使能套件及工具链全面开源、openPangu基础大模型全面开源,多项开源计划于2025年12月31日前完成 [2] - 未来三年规划三个芯片系列:即将推出的Ascend 950系列(含950PR和950DT两颗芯片)、以及规划中的Ascend 960和Ascend 970系列 [3] - Ascend 950系列实现根本性提升:新增支持FP8/MXFP8/MXFP4/HiF8等低精度格式,算力达1P/2P FLOPS;大幅提升向量算力;互联带宽相比910C提升2.5倍至2TB/s;自研两种HBM(HiBL 1.0和HiZQ 2.0)与Die合封,分别面向Prefill/推荐场景和Decode/训练场景 [3][4][5] - Ascend 950PR芯片采用自研低成本HBM(HiBL 1.0),面向推理Prefill阶段和推荐业务,计划2026年一季度推出 [5] - Ascend 950DT芯片采用自研HiZQ 2.0 HBM,内存容量144GB,访问带宽4TB/s,互联带宽2TB/s,面向推理Decode和训练场景,计划2026年四季度推出 [6] - Ascend 960芯片各项规格相比950翻倍,支持自研HiF4数据格式,计划2027年四季度推出 [6] - Ascend 970芯片规划FP4/FP8算力及互联带宽全面翻倍,内存访问带宽至少增加1.5倍,计划2028年四季度推出,实现几乎一年一代算力翻倍的演进速度 [7][12] Atlas超节点产品发布 - Atlas 900超节点满配384颗Ascend 910C芯片,最大算力300 PFLOPS,截至2025年已部署超300套,服务20多个客户 [8] - 发布基于Ascend 950DT的Atlas 950超节点:支持8192张昇腾卡,由160个机柜组成,占地面积约1000平方米,FP8算力8E FLOPS,FP4算力16E FLOPS,互联带宽16PB/s(超全球互联网峰值带宽10倍),计划2026年四季度上市 [9] - Atlas 950超节点对比英伟达NVL144:卡规模为其56.8倍,总算力为其6.7倍,内存容量1152TB为其15倍,互联带宽16.3PB/s为其62倍;相比Atlas 900,训练性能提升17倍至4.91M TPS,推理性能提升26.5倍至19.6M TPS [10] - 发布基于Ascend 960的Atlas 960超节点:最大支持15488卡,由220个机柜组成,占地面积约2200平方米,FP8总算力30E FLOPS,FP4总算力60E FLOPS,内存容量4460TB,互联带宽34PB/s,训练/推理性能相比Atlas 950提升3倍/4倍以上至15.9M TPS/80.5M TPS,计划2027年四季度上市 [11][13] 鲲鹏处理器与通用计算超节点 - 鲲鹏处理器围绕支持超节点、多核高性能方向演进,2026年一季度将推出Kunpeng 950处理器,含96核/192线程和192核/384线程两个版本,支持通用计算超节点,新增四层隔离实现机密计算 [14] - 发布全球首个通用计算超节点TaiShan 950:基于Kunpeng 950打造,最大支持16节点32个处理器,最大内存48TB,支持内存/SSD/DPU池化,计划2026年一季度上市 [16] - TaiShan 950结合GaussDB多写架构,无需分布式改造即可实现性能提升2.9倍,平滑替代大型机/小型机及Oracle Exadata;在虚拟化环境内存利用率提升20%,Spark大数据场景实时处理时间缩短30% [16][17] - 提出混合超节点概念:结合TaiShan 950和Atlas 950,构建PB级共享内存池支持超高维度用户特征,并提供超大AI算力支持超低时延推理,为下一代生成式推荐系统提供新架构 [17] 超节点互联技术突破 - 攻克大规模超节点互联两大挑战:通过系统性创新实现长距离(超200米)高可靠光互联(可靠性提升100倍)以及大带宽(TB级)低时延(2.1微秒)互联 [18][19] - 推出超节点互联协议“灵衢”(UB - UnifiedBus),具备总线级互联、平等协同等六大特征;灵衢1.0已随Atlas 900商用部署300多套,Atlas 950基于灵衢2.0,华为将开放灵衢2.0以共建生态 [19][20] - 超节点架构核心价值为“万卡超节点,一台计算机”,通过灵衢协议将数万计算卡联接成一体工作 [19] 超级计算集群规划 - 发布Atlas 950 SuperCluster集群:由64个Atlas 950超节点互联组成,集成52万多片昇腾950DT卡,FP8总算力524E FLOPS,支持UBoE与RoCE协议(推荐UBoE),计划2026年四季度上市 [21] - Atlas 950 SuperCluster集群规模为xAI Colossus的2.5倍,算力为其1.3倍,支持千亿至十万亿参数大模型训练 [22] - 规划Atlas 960 SuperCluster集群:规模达百万卡级,FP8总算力2 ZFLOPS,FP4总算力4 ZFLOPS,支持UBoE与RoCE,计划2027年四季度推出 [22]
徐直军详解华为最强“算力核弹”
观察者网· 2025-09-18 21:24
芯片产品规划 - 昇腾950系列芯片支持FP8/MXFP8/MXFP4等低数值精度格式,算力达1P-2P FLOPS,自研HiF8格式精度接近FP16,包含面向Prefill场景的950PR和面向Decode场景的950DT两款合封芯片,均计划2026年上市 [3] - 昇腾960芯片性能较950翻倍,支持自研HiF4格式,推理精度优于业界FP4方案,计划2027年四季度推出 [7] - 昇腾970芯片FP4/FP8算力及互联带宽较960全面翻倍,内存访问带宽提升1.5倍,计划2028年四季度推出 [7] - 鲲鹏950处理器包含96核/192线程和192核/384线程两个版本,为首款支持机密计算的数据中心处理器,计划2025年一季度推出 [13] - 鲲鹏960处理器包含96核/192线程高性能版和不少于256核/512线程高密版,计划2028年一季度推出 [13] 超节点系统 - Atlas 950超节点基于8192颗昇腾950DT芯片构建,包含160个机柜(128计算柜+32互联柜),占地1000平方米,FP8算力达8E FLOPS,FP4算力达16E FLOPS,互联带宽16PB/s(超全球互联网峰值带宽10倍),计划2026年四季度上市 [11] - 对比英伟达NVL144系统,Atlas 950芯片规模为其56.8倍,总算力为其6.7倍,内存容量1152TB为其15倍,互联带宽16.3PB/s为其62倍 [11] - Atlas 960超节点基于15488颗昇腾960芯片构建,包含220个机柜(176计算柜+44互联柜),占地2200平方米,FP8算力30E FLOPS,FP4算力60E FLOPS,内存容量4460TB,互联带宽34PB/s,计划2027年四季度推出 [13] - TaiShan 950超节点为全球首款通用计算超节点,基于鲲鹏950处理器,最大支持32处理器/48TB内存,支持内存/SSD/DPU池化,计划2025年一季度上市 [13] 算力集群架构 - Atlas 950 SuperCluster集群由64个Atlas 950超节点互联组成,集成52万片昇腾950DT芯片,FP8总算力524E FLOPS,规模为xAI Colossus集群2.5倍,算力为其1.3倍 [18] - Atlas 960 SuperCluster集群计划2027年四季度推出,规模达百万卡级,FP8总算力2Z FLOPS,FP4总算力4Z FLOPS [19] - 自研"灵衢(UB)"互联协议支持万卡级超节点架构,具备总线级互联/平等协同/全量池化等六大特性,并开放灵衢2.0技术规范构建生态 [17] 软件生态战略 - CANN编译器与虚拟指令集接口开放,其余软件全开源,基于昇腾910B/C的开源计划2025年12月31日前完成 [22] - Mind系列应用使能套件及工具链全面开源,计划2025年12月31日前完成 [22] - openPangu基础大模型全面开源 [22] 技术突破方向 - 自研两种低成本HBM内存技术,分别适配Prefill推荐场景和Decode训练场景 [3] - 通过光通信/网络/供电技术集成384颗昇腾芯片构建超节点,计算与通信高速并行,已部署超300套 [10] - TaiShan 950超节点结合GaussDB多写架构可实现大型机/小型机替代,性能提升2.9倍 [15] - 推出TaiShan 950与Atlas 950混合超节点,支持PB级推荐系统嵌入表和超低时延推理 [15]
徐直军,最新发声!
中国基金报· 2025-09-18 21:23
昇腾芯片发展规划 - 公司规划未来三年推出昇腾950、960、970三个系列芯片 [2][5] - 芯片演进速度将达到几乎一年一代且算力翻倍 [2][4][5] - 昇腾950系列相比前代有四大根本性提升:新增支持FP8/MXFP8/MXFP4等低数值精度格式,算力达1P和2P;通过提升向量算力占比等设计大幅提升向量算力;互联带宽达2TB/s,较昇腾910C提升2.5倍;自研HiBL1.0和HiZQ 2.0两种HBM与Die合封 [5] - 昇腾960计划于2027年四季度推出,在算力、内存访问带宽等规格上较昇腾950全面翻倍,并支持自研HiF4数据格式 [6] - 昇腾970初步计划FP4算力、FP8算力、互联带宽较昇腾960翻倍,内存访问带宽至少增加1.5倍 [7] 超节点与集群产品 - 公司发布Atlas 950超节点、Atlas 960超节点、TaiShan 950超节点三款超节点产品 [9] - 推出新型互联协议“灵衢”,并开放灵衢2.0技术规范以促进产业生态 [9][10] - Atlas 950 SuperCluster集群规模是当前世界最大集群xAI Colossus的2.5倍,算力是其1.3倍 [10] - 计划在2027年四季度基于Atlas 960超节点推出Atlas 960 SuperCluster,集群规模将提升至百万卡级 [10]
ETF日报:目前国产算力发展趋势树立,科技行业有望迎来较大级别的发展良机
新浪基金· 2025-09-18 20:30
市场表现 - 三大指数冲高回落 沪指跌1.15% 深成指跌1.06% 创业板指跌1.64% [1] - 沪深两市成交额3.135万亿元 较上一交易日放量7584亿元 创年内第三高 [1] - 半导体板块强势冲高后回落 半导体设备ETF收涨4% 科创芯片ETF收涨2.28% [1] - 港股科技ETF收跌1.57% [4] 华为AI算力布局 - 华为公布AI算力全景图 芯片以一年一代算力翻倍速度发展 [2] - 昇腾950PR芯片预计2026年Q1推出 950DT于2026年Q4推出 960芯片于2027年Q4推出 970芯片于2028年Q4推出 [2] - Atlas 900超节点累计部署超300套 服务20多个客户 [2] - Atlas 950超节点2026年Q4上市 960超节点2027年Q4上市 [2] - 发布Atlas 950 SuperCluster集群支持50万卡 Atlas 960 SuperCluster支持百万卡 [2] 半导体产业动态 - 中芯国际测试上海宇量昇28nm深紫外光刻机 采用多重曝光技术生产7nm芯片 [3] - 光刻机国产替代率接近0% 技术突破难度最大 [3] - 英伟达违反反垄断法遭市场监管总局进一步调查 [3] - 英伟达在华销售持续受阻 国产算力替代率有望大幅提升 [3] 投资配置方向 - 通信ETF含光模块+服务器+铜连接+光纤含量超78% 代表北美算力 [4] - 创业板人工智能ETF光模块占比超51% [4] - 国产算力关注半导体设备ETF 科创芯片ETF 芯片ETF 集成电路ETF [4] 美联储政策影响 - 美联储降息25基点至4-4.25% 释放10月继续降息信号 [5] - 点阵图显示今年三次降息 鲍威尔定位为"风险管理型降息" [5] - 港股与美股相关系数接近95% [5] - 历史非衰退式降息后恒生指数震荡走强 科技行业降息后12个月平均上涨88% [5][6] 港股科技板块机遇 - AI为科技行业核心赛道 港股聚集中国科技核心资产 [7] - 港股通科技指数长期跑赢恒生科技指数和港股通互联网指数 [7] - 科技行业有望迎基本面与估值戴维斯双击 [7] - 港股科技ETF覆盖互联网 新能源车 芯片 生物医药等多领域 [7]