Workflow
超节点(SuperPoD)
icon
搜索文档
蚂蚁透露!部署的万卡国产算力集群已媲美国际,超节点有望成国产算力加速发展重要动力
选股宝· 2025-11-10 07:32
在2025年世界互联网大会·乌镇峰会上,阿里巴巴集团CEO吴泳铭表示,阿里巴巴正在建设超大规模AI 基础设施,加大投入打造超级AI云。 此外,蚂蚁集团平台技术事业群总裁骆骥也发表了主题演讲,表示在算力方面,蚂蚁已部署万卡规模的 国产算力集群,适配自研与各主流开源模型,训练任务稳定性超过98%,训练与推理性能可媲美国际算 力集群,并全面应用于安全风控领域的大模型训练与推理服务。 民生证券认为,超节点有望成为集群扩展下的主流技术,在集群训练、推理等方面具有重要潜力,助力 国产算力生态不断完善,成为国产算力加速发展的重要动力。 分析称,大模型发展呈现多个发展趋势,推动业界转向算法效率与底层架构的根本创新。 跨服务器张量并行(TP)成为必然选择,其跨设备的TP All-Reduce通信是大规模分布式训练性能提升 的主要瓶颈;混合专家(MoE)模型的规模化应用使跨服务器专家并行(EP)成为关键技术需求,跨 服务器的All-to-All通信成为新瓶颈。 中科曙光:公司发布世界上首个640卡单机柜超节点——Scale X640,挑战单卡算力受限、带宽容量受 限、网络通信受限、芯片设计功耗增加、零部件组件海量等问题。该超节点 ...