Workflow
华为云CEO:384超节点每卡性能可达英伟达H20三倍

公司战略与定位 - 华为云强调以提供客户所需计算结果为核心目标 而非单纯依赖芯片工艺[1] - 公司通过系统级创新弥补单点短板 包括以空间换算力 以带宽换算力 以能源换算力[1] - 组织架构调整为聚焦3+2+1业务:通算 智算 存储三大基础服务 AI PaaS与数据库两大平台 安全业务一个核心[6] - 调整目的为集中资源最大化"昇腾AI+盘古"组合优势 砍掉协同效应弱的外围研发[6] 技术突破与产品进展 - 发布CloudMatrix384超节点 集成384颗昇腾NPU和192颗鲲鹏CPU 算力达300 PFlops[2] - 通过xDeepServe架构实现单芯片2400TPS吞吐量与50msTPOT时延 超越业界水平[2][3] - xDeepServe采用Transformerless分离架构 将MoE大模型拆分为Attention/FFN/Exper微模块并行处理[3] - 超节点单卡吞吐量从600tokens/s提升至2400tokens/s 达H20芯片效率的三倍[3] - 支持横向扩展至16万卡AI集群 可同时训练1300个千亿参数大模型[2] 市场表现与客户增长 - 昇腾AI云服务客户数从321家增长至1714家 同比增长434%[5] - 整体算力规模同比增长接近250%[5] - 在中国大陆云服务市场占据18%份额 位列第二[6] - 智能驾驶领域取得突破 引望(中国最大智驾企业)已部署于昇腾平台[6] - CloudMatrix384在感知模型/E2E/VLA模型测试中达到H100的2.5-3倍性能[6] 基础设施布局 - 围绕贵安 乌兰察布 和林格尔 芜湖打造全国算力一张网[5] - 仅在贵州已部署超40套CloudMatrix384超节点[5] - 华为云贵安汽车专区正式上线 长安天枢智驾搭载CloudMatrix384亮相[5] - 云服务连续756天保持重大事故为零记录[5] 行业趋势与认知 - 未来十年算力需求可能有数万倍增长[1] - 市场主流需求从"上云"转向"上AI" AI工作负载成为云业务核心引擎[6] - 需以AI原生思维重构应用 数据 流程和人员组织[7] - 中国拥有千行万业业务场景 有望在各行业构筑全球AI领先优势[7]