Oracle and AMD Collaborate to Help Customers Deliver Breakthrough Performance for Large-Scale AI and Agentic Workloads
核心观点 - Oracle将成为首批提供搭载AMD Instinct MI355X GPU的AI超级计算机的超大规模云服务商[1] - 公司将在OCI上部署zettascale AI集群,最多支持131072个MI355X GPU,帮助客户大规模构建、训练和推理AI[1] - 与上一代相比,新方案提供超过2倍的价格性能比[1] 技术合作 - Oracle与AMD合作,在OCI上提供AMD Instinct MI355X GPU,满足客户对高性能、效率和系统设计灵活性的需求[3] - AMD Pollara AI NIC将首次在Oracle的后端网络中部署,提供先进的RoCE功能[5] 性能提升 - MI355X GPU提供近3倍的计算能力和50%的高带宽内存提升[2] - 新方案支持高达288GB的HBM3内存和8TB/s的内存带宽[4] - 支持FP4标准,实现超高效和高速推理[4] 架构设计 - 采用高吞吐量、超低延迟的RDMA集群网络架构[2] - 每机架功率达125千瓦,每机架配备64个GPU,每个GPU功耗1400瓦[4] - 配备AMD Turin高频CPU,系统内存高达3TB[4] 应用场景 - 专为生产规模的训练和推理设计,支持新型代理应用[4] - 适用于运行当今最大语言模型和AI工作负载的客户[4] - 提供开源堆栈AMD ROCm,支持灵活架构和代码迁移[4]