Nvidia-华为云CEO：384超节点每卡性能可达英伟达H20三倍

公司战略与定位 - 华为云强调以提供客户所需计算结果为核心目标而非单纯依赖芯片工艺[1] - 公司通过系统级创新弥补单点短板包括以空间换算力以带宽换算力以能源换算力[1] - 组织架构调整为聚焦3+2+1业务：通算智算存储三大基础服务 AI PaaS与数据库两大平台安全业务一个核心[6] - 调整目的为集中资源最大化"昇腾AI+盘古"组合优势砍掉协同效应弱的外围研发[6] 技术突破与产品进展 - 发布CloudMatrix384超节点集成384颗昇腾NPU和192颗鲲鹏CPU 算力达300 PFlops[2] - 通过xDeepServe架构实现单芯片2400TPS吞吐量与50msTPOT时延超越业界水平[2][3] - xDeepServe采用Transformerless分离架构将MoE大模型拆分为Attention/FFN/Exper微模块并行处理[3] - 超节点单卡吞吐量从600tokens/s提升至2400tokens/s 达H20芯片效率的三倍[3] - 支持横向扩展至16万卡AI集群可同时训练1300个千亿参数大模型[2] 市场表现与客户增长 - 昇腾AI云服务客户数从321家增长至1714家同比增长434%[5] - 整体算力规模同比增长接近250%[5] - 在中国大陆云服务市场占据18%份额位列第二[6] - 智能驾驶领域取得突破引望（中国最大智驾企业）已部署于昇腾平台[6] - CloudMatrix384在感知模型/E2E/VLA模型测试中达到H100的2.5-3倍性能[6] 基础设施布局 - 围绕贵安乌兰察布和林格尔芜湖打造全国算力一张网[5] - 仅在贵州已部署超40套CloudMatrix384超节点[5] - 华为云贵安汽车专区正式上线长安天枢智驾搭载CloudMatrix384亮相[5] - 云服务连续756天保持重大事故为零记录[5] 行业趋势与认知 - 未来十年算力需求可能有数万倍增长[1] - 市场主流需求从"上云"转向"上AI" AI工作负载成为云业务核心引擎[6] - 需以AI原生思维重构应用数据流程和人员组织[7] - 中国拥有千行万业业务场景有望在各行业构筑全球AI领先优势[7]