华为云黄瑾:六大科技创新,昇腾云定义下一代AI基础设施
经济网·2025-05-19 16:17
"随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁,超节点架构的诞生不仅是 技术的突破,更是以工程化创新开辟AI产业的新路径。"5月16日,华为云副总裁黄瑾在华为云AI峰会上表示。 据黄瑾介绍,华为云CloudMatrix 384超节点具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大领 先技术优势,以系统架构创新重新定义新一代AI基础设施。 黄瑾表示,面对这些挑战,华为云创新性的推出了采用全对等互联架构的CloudMatrix 384超节点。这项技术创新跳出单点 技术限制走向系统性、工程性的创新算力架构,直面通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战。通过新型高速互 联总线实现384 张卡互联成为一个超级云服务器,最高提供300Pflops的算力规模,比业界同类产品领先67%。 六大优势,重新定义AI基础设施架构 目前,基于CloudMatrix的超节点集群已经在芜湖、贵安、内蒙古规模上线,黄瑾总结了六大技术创新点,即MoE亲和架 构,从"小作坊"到"超级工厂";以网强算,双层网络破解"数据堵车";以存强算,弹性内存改写"算存绑定";长稳可靠,故障 ...