产品发布核心 - Nebius宣布推出其全栈AI云平台的最新版本Nebius AI Cloud 3.1,该版本引入了下一代NVIDIA Blackwell Ultra计算能力并增强了运营能力 [1] 产品升级背景与客户需求 - 客户正从实验阶段转向大规模应用AI,其明确的运营重点包括:跨区域的GPU容量实时可见性、多团队环境的透明资源分配,以及随着模型复杂度增加而获得下一代计算资源的访问权限 [2] - Nebius AI Cloud 3.1从三个维度满足这些需求 [2] 下一代计算基础设施 - 公司正在全球部署NVIDIA Blackwell Ultra基础设施,客户已开始使用NVIDIA GB300 NVL72系统和NVIDIA HGX B300系统 [3] - Nebius成为欧洲首个在生产环境中同时运营这两个平台的云服务商 [3] - Nebius AI Cloud也是全球首个在生产环境中使用800 Gbps NVIDIA Quantum-X800 InfiniBand互连运行GB300 NVL72系统的提供商,将分布式工作负载的吞吐量提升了一倍 [3] - 结合硬件加速网络和增强的存储缓存以消除基础设施瓶颈,这些升级进一步巩固了其在MLPerf® Training v5.1基准测试中的领先成绩 [3] 运营可见性与效率提升 - 版本3.1引入了容量区块和实时容量仪表板,为客户提供其所有数据中心区域预留GPU容量和可用性的完整可见性 [4] - 项目级配额和新的生命周期对象存储规则扩展了对资源分配和成本的精细控制 [4] - 平台提供跨所有区域的实时GPU可用性视图 [9] - 新的生命周期对象存储规则有助于成本优化 [9] 开发者生产力与平台生态 - 平台生态系统持续扩展,包括与Dstack的新原生集成 [5] - 版本3.1简化了NVIDIA BioNeMo NIM微服务的部署和使用,无需NGC密钥或NVIDIA AI Enterprise许可证,涵盖的微服务包括Boltz2, Evo-2, GenMol, 和 MolMIM [5] - 专注于开发者可用性的增强功能包括:基于Slurm的增强编排、符合FOCUS标准的账单导出以及各种控制台用户体验改进 [5] - 平台提供NVIDIA BioNeMo NIM微服务以支持医疗保健与生命科学工作流 [9] - 提供基于Slurm的扩展和Dstack原生支持,以及符合FOCUS标准的账单导出以支持FinOps集成 [9] 安全与治理增强 - 新版本在原有企业级安全基础上,增加了用于符合HIPAA标准的对象存储数据平面审计日志、每对象访问控制以及VPC安全组 [6] - 通过集成Microsoft Entra ID和精细服务角色增强了IAM,提供更强大的治理和简化的管理 [6] - 安全功能具体包括:用于符合HIPAA配置的对象存储数据平面事件审计日志和每对象访问控制,用于网络级保护的VPC安全组,以及集成Microsoft Entra ID登录、可视化SSO管理和精细服务角色的增强IAM [12] 公司背景 - Nebius是一家为全球AI行业构建全栈云基础设施的技术公司,总部位于阿姆斯特丹,在纳斯达克上市 [10] - 公司在全球设有研发中心,遍布欧洲、北美和以色列 [10] - Nebius AI Cloud专为密集型AI工作负载从头构建,通过内部设计的专有软硬件,为AI构建者提供所需的计算、存储、托管服务和工具 [11]
Nebius AI Cloud 3.1 Delivers Next-Generation NVIDIA Blackwell Ultra Compute with Transparent Capacity Management for AI at Scale