Workflow
Atlas 350
icon
搜索文档
华为重磅发布新一代算力加速卡
新华网财经· 2026-03-22 08:48
华为昇腾950PR芯片及Atlas 350加速卡发布与商用 - 华为在合作伙伴大会2026上正式发布并展出了搭载全新昇腾950PR处理器的AI训练推理加速卡Atlas 350 [1][7] - 昇腾950PR芯片按计划在2026年第一季度推出,首先支持的产品形态是标卡和超节点服务器 [6] - 昆仑、华鲲振宇、神州鲲泰等7家华为核心伙伴同步发布了基于Atlas 350的服务器整机产品,标志着昇腾950代际推理算力正式进入商用阶段 [3] Atlas 350产品性能与技术参数 - Atlas 350的单卡算力达到英伟达H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品 [9] - 其FP4精度算力为1.56P,HBM容量为112GB(是H20的1.16倍),带宽达到1.4TB/s,功耗为600W(是H20的1.5倍) [9] - 与前代相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升,内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍 [9] - 该卡支持FP16、FP8及FP4精度,支持更大的模型和更低时延的推理,在互联网推荐场景实测中时延更低、响应更快,适合短视频、电商等高并发场景 [11] - 在大模型推理、文生图、文生视频等多模态场景,其性能与英伟达的L20相当 [11] 合作伙伴产品与生态进展 - 上市公司软通动力旗下软通华方发布了基于Atlas 350的“超强A860 A5”6U2路AI服务器,搭载鲲鹏920处理器,可支持8块Atlas 350加速卡,适用于AI大模型训练推理等场景 [5] - 科大讯飞表示其新一代星火大模型将与昇腾910/950系列算力底座进行充分适配 [5] - 昇腾联合20家行业头部伙伴发布了2026昇腾AI应用场景解决方案,覆盖辅助办公、AI实训、电子病历等多个核心场景 [12] - 过去一个多月已有十几家合作伙伴推出了基于昇腾的OpenClaw一体机,昇腾已联合伙伴打造400多款行业一体机,服务客户超过2700家,占据国内一体机市场80%以上份额 [12] 昇腾算力战略与场景规划 - 昇腾芯片是华为AI算力战略的基础,系列产品包括2018年的昇腾310、2019年的昇腾910以及2025年随Atlas900部署的昇腾910C [5] - 基于Atlas 350等产品,昇腾将打造大、中、小三大核心算力场景以应对差异化需求 [11] - 面向万亿级模型,昇腾384超节点凭借超大带宽等特性实现有效算力线性扩展;面向千亿级模型,提供“开箱即用”的单机服务器;面向百亿级模型,开放更多算力档位、更高集成度的模组/板卡 [12]
2025华为全联接大会解读:昇腾铸芯、超节点织网,华为算力跃升新纪元
东北证券· 2025-09-19 10:41
行业投资评级 - 电子行业评级为"优于大势" [6] 核心观点 - 华为通过昇腾芯片与超节点产品实现系统级创新 在AI算力基础设施领域实现全面突破 为国产算力提供持续替代方案 [1][3] - 昇腾芯片保持"一年一代"迭代节奏 2025-2028年将陆续推出910C/950PR/950DT/960/970系列 算力与带宽性能持续提升 [1][14] - 超节点产品通过灵衢协议和UB-Mesh架构实现高可靠全光互联 覆盖从数据中心到企业级的多样化算力需求 [1][2][24] - 华为在HBM存储器、芯片架构设计和工艺技术方面实现自研突破 逐步补齐与行业龙头的性能差距 [3][15][21] 昇腾芯片产品线 - 昇腾910C已于2025Q1发布 提供800 TFLOPS@FP16算力和3.2TB/s内存带宽 [14][20] - 昇腾950系列将于2026年推出:950PR专注推理和推荐场景 配备1.6TB/s带宽HBM;950DT专注训练和解码场景 配备4TB/s带宽HBM [1][15][16] - 昇腾960计划2027Q4发布 算力、内存容量、内存带宽和互联端口均实现翻倍 达2 PFLOPS@FP8和9.6TB/s带宽 [18][20] - 昇腾970计划2028Q4发布 FP8算力进一步提升至4 PFLOPS 内存带宽达14.4TB/s [19][20] 超节点数据中心产品 - Atlas 900 A3 SuperPoD支持384卡互联 总算力300 PFLOPS 已部署超300套 [27] - Atlas 950 SuperPoD支持8192卡无收敛互联 算力达8 EFLOPS@FP8 互联带宽16.3 PB/s 性能达英伟达NVL144的6.7倍 [30][33] - Atlas 960 SuperPoD计划2027H2发布 支持15488卡互联 算力提升至30 EFLOPS@FP8 互联带宽34 PB/s [33] 超节点集群与企业级产品 - Atlas 950 SuperCluster由64个SuperPoD组成 总算力达524 EFLOPS@FP8(1 ZFLOPS@FP4) 网络时延降低23% 光模块数量减少26% [37] - 企业级风冷服务器Atlas 850支持8颗NPU 算力8 PFLOPS@FP8 后训练吞吐提升3倍 推理时延降至10毫秒 [38][39] - Atlas 860计划2027Q4发布 FP8算力翻倍至16 PFLOPS 显存容量提升至2304GB [39][40] 标卡与鲲鹏产品 - Atlas 350标卡支持850 TFLOPS@FP16算力 128GB HBM3E内存 专为高并发推理和多模态生成任务优化 [41][42] - 鲲鹏950芯片计划2026Q4发布 支持96C/192T规格 TaiShan 950 SuperPoD数据库处理能力提升2.9倍至5.4mn tpmC [44][45] 产业链与合作伙伴 - 昇腾上游产业链涵盖晶圆代工、铜连接(华丰科技)、光连接(华工科技)、电源(泰嘉股份)、PCB(深南电路等)及散热(飞荣达等)领域 [4][46] - 硬件合作伙伴包括科思科技(688788)、华大智造(688114)、广电五舟(831619)、软通动力(301236)等20余家企业 [47][49] - 大模型应用一体机合作伙伴包括蓝凌软件(834906)、恒生电子(600570)、金山办公(688111)、科大讯飞(002230)等30余家企业 [50]
华为宣布推出超节点架构,可将多台物理机器深度互联
新浪科技· 2025-09-18 14:39
产品发布 - 华为推出创新的超节点架构 实现多台物理机器深度互联 逻辑层面像一台机器一样学习 思考与推理 [2] - 发布标卡 模组 服务器 集群等多款超节点产品 包括全液冷数据中心AI超节点Atlas 950 SuperPoD 企业级风冷AI超节点服务器Atlas 850和Atlas 860 AI新一代标卡Atlas 350 业界首个通算超节点Taishan 950 SuperPoD [2] 技术特性 - 超节点架构基于灵衢互联协议 具备资源池化 规模扩展 长稳可靠的关键特性 [2] - 实现计算 存储单元的大带宽和低时延互联 通过统一协议和内存编址 使有效算力能够随集群规模线性扩展 并大幅提升集群可靠性 [2] 生态战略 - 华为坚持硬件开放 软件开源 支持伙伴打造面向行业的超节点场景化解决方案 [2] - 全面开放超节点技术 与产业界共享技术红利 共同推动超节点技术走向普惠与协同创新 [3] - 操作系统灵衢组件全部开源 组件代码将陆续合入openEuler等多个上游操作系统开源社区 [3] 应用场景 - 昇腾围绕超节点架构打造全系列产品 满足大型数据中心 企业级数据中心和小型工作站等全场景算力需求 [2]