Workflow
AMD卖掉50000颗GPU,英伟达暴跌
半导体行业观察·2025-10-15 10:48

甲骨文与AMD合作的核心内容 - 甲骨文在AI World 2025大会上宣布与AMD扩大合作,将斥资打造基于AMD未来Altair GPU的AI超级集群[2] - 合作涉及甲骨文云基础设施将成为首个由AMD Instinct MI450系列GPU驱动的公开AI超级集群的发布合作伙伴[9] - 计划于2026年第三季度开始部署50,000块GPU,并在2027年及以后逐步扩展[6][9] AMD Altair MI450系列GPU技术规格 - MI450芯片采用台积电2纳米工艺,预计以FP4精度处理约40 petaflops峰值计算能力,配备432 GB HBM4显存,提供19.6 TB/秒显存带宽[2] - MI450X用于"Helios"双宽AI机架,可扩展至64或128个GPU,128 GPU版本每个GPU提供50 petaflops浮点运算速度[3] - MI450系列GPU将提供高达432 GB HBM4显存和20 TB/秒内存带宽,使客户能够完全在内存中训练和推断比前几代产品大50%的模型[11] Helios机架系统架构 - Helios机架采用液冷式设计,容纳72个GPU,在FP8精度下提供1.45 exaflops计算能力,FP4精度下提供2.9 exaflops计算能力[5] - 机架配备31 TB HBM4内存和1.4 PB/秒聚合带宽,每个GPU最多配备三个Vulcano DPU,每个DPU带宽800 Gb/秒[5] - 系统集成下一代AMD EPYC "Venice"处理器和AMD Pensando "Vulcano" DPU,采用UALink互连技术实现GPU间直接硬件一致性网络和内存共享[10][13] 集群规模与投资估算 - 部署50,000个Altair GPU插槽相当于约700个机架[6] - 700个机架总成本估计在35亿美元到40亿美元之间,包括存储和网络成本[6] - 拥有50,000个GPU插槽的机器将消耗约200兆瓦电力[7] OCI部署计划与客户价值 - OCI将于2024年推出基于AMD Instinct MI300X机型,随后推出搭载AMD Instinct MI355X GPU的OCI Compute通用版本[9] - MI450集群是通用OCI基础设施一部分,并非专用,Oracle客户将能够租用MI450集群时间[7] - 搭载AMD Instinct MI355X GPU的机型可扩展至131,072块GPU,设计兼具卓越价值、云灵活性和开源兼容性[15] 技术优势与创新 - 采用DPU作为集成交换机,在大规模AI横向扩展网络中减少一层设备[7] - 通过开源AMD ROCm软件堆栈为客户提供开放、灵活的编程环境[14] - 支持高级分区和虚拟化,包括细粒度GPU分区、SR-IOV虚拟化和多租户功能[14]