Workflow
华为云黄瑾:传统计算架构难支撑AI代际跃迁,超节点架构是创新
贝壳财经·2025-05-16 20:56

华为云AI技术突破 - 公司推出CloudMatrix 384超节点架构,解决传统计算架构难以支撑AI技术代际跃迁的问题 [1] - 该架构通过新型高速互联总线实现384张卡互联,提供300Pflops算力规模,比英伟达NVL72提升67% [1] - 超节点架构具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势 [1] 算力需求与瓶颈 - AI算力需求在过去8年增长1万倍,但单卡硬件算力仅增长40倍,节点内总线带宽增长9倍,跨节点网络带宽仅增长4倍 [1] - 集群网络通信成为当前大模型训练和推理的最大挑战 [1] 技术优势与创新 - 超节点架构通过高速互联总线实现一卡一专家高效分布式推理,单卡MoE计算和通信效率大幅提升 [2] - MatrixLink服务具有两层网络,超节点内384张卡互联时延低至微秒 [2] - EMS弹性内存存储通过内存池化技术实现显存和算力解绑,首Token时延最高降低80% [2] - 昇腾云脑运维"1-3-10"标准将硬件故障感知率从40%提升至90% [2]