微软(MSFT.US)“AI超级工厂“启动!整合数十万GPU,可实现多个数据中心互联
公司战略与设施部署 - 微软在亚特兰大上线新一代AI数据中心,并于10月投入运营,该设施是"Fairwater"系列中的第二个 [1] - 该数据中心通过专用网络与威斯康星州的首个Fairwater站点相连,构建起全球首个真正意义上的跨州AI计算集群 [1] - 公司本季度有超过10万个GB300上线,用于其他基础设施群的推理工作 [2] 技术架构与能力 - 数据中心被称为"AI超级工厂",整合了数十万个最新NVIDIA Blackwell GPU,提供支持AI工作负载的算力 [1] - 该网络支持微软投资的OpenAI,并将多个地理上分散的数据中心融合成一个虚拟的单一超级计算机 [1] - 数据中心通过专用光缆连接的AI广域网进行互联,形成一个统一的分布式系统 [2] 运营模式与行业影响 - "AI超级工厂"模式的核心是在数百万个硬件上运行一个复杂的作业,而非为多个客户运行数百万个独立的应用程序 [1] - 该模式使得一个站点网络能共同支持同一项AI模型训练任务,训练所需的基础设施规模是传统一两个数据中心的数倍 [1][2] - 公司愿景是实现可互换基础设施群,能够在任何地方基于专用加速器和网络路径,以最高性能和效率运行任何工作负载,确保没有GPU被闲置 [2]