AMD Instinct MI300X GPU
搜索文档
AMD Powers Frontier AI Training for Zyphra
Globenewswire· 2025-11-24 22:01
技术里程碑 - Zyphra公司成功开发首个基于AMD GPU和网络平台训练的大规模混合专家模型ZAYA1 [1] - 该成就依托AMD Instinct MI300X GPU、AMD Pensando网络以及AMD ROCm开放软件栈实现 [1] 模型性能表现 - ZAYA1模型在推理、数学和编码基准测试中展现出与领先开源模型相当或更优的性能 [2] - ZAYA1-Base模型总参数量83亿,激活参数量760亿,性能匹配或超越Qwen3-4B、Gemma3-12B、Llama-3-8B及OLMoE等模型 [4] 硬件平台优势 - AMD Instinct MI300X GPU的192GB高带宽内存支持高效大规模训练,避免了昂贵的专家或张量分片 [4] - 采用AMD优化的分布式I/O使模型保存速度提升超过10倍,增强了训练可靠性和效率 [4] 产业合作生态 - Zyphra与AMD和IBM紧密合作,设计并部署了由AMD Instinct GPU和Pensando网络互连驱动的大规模训练集群 [4] - 该合作系统结合AMD Instinct MI300X GPU与IBM Cloud的高性能架构和存储,为ZAYA1大规模预训练奠定基础 [4] 公司战略定位 - AMD在加速计算领域的领导地位正赋能创新者突破AI可能性边界 [3] - Zyphra强调效率为核心指导原则,致力于通过协同设计模型架构与硅晶系统为客户提供前沿智能 [3]
苏姿丰出手,Oracle下单5万颗AMD芯片,英伟达王座撼动
36氪· 2025-10-16 08:39
合作概述 - Oracle宣布自2026年第三季度起,将在其OCI首期部署5万颗AMD Instinct™ MI450系列GPU,构建AI超级集群,并计划于2027年及以后持续扩展 [1] - 此次合作旨在将AMD Instinct GPU平台的算力直接提供给OCI客户 [2] - 合作延续了Oracle与AMD在AI加速领域的紧密关系,双方正构建新的AI算力生态 [4] 技术规格与优势 - AMD Instinct MI450系列GPU配备432GB HBM4内存与20TB/s带宽,可在相同内存条件下训练比上一代大50%的模型 [7] - 采用新一代液冷架构「Helios」,为高密度72-GPU液冷机架设计,结合UALoE与UEC标准互联以提升跨机架通信速度 [7] - 搭载新一代AMD EPYC 「Venice」 CPU以优化调度与数据处理,并支持机密计算 [7] - 融合AMD Pensando DPU与「Vulcano」AI-NIC技术,实现800Gbps高速、低延迟网络 [7] - AMD ROCm™软件栈为开发者提供灵活开放的编程环境,支持主流AI框架与库 [8] 市场影响与战略意义 - 合作公告后,AMD股价走强,盘中/收盘涨幅在约0.8%–3%之间 [4] - 此次合作是AMD在与Nvidia争夺快速增长的AI芯片市场中所取得的重要突破 [10] - 截至2025年第二季度,在数据中心GPU市场,英伟达保持主导地位,市场份额达到92% [17] - 合作被视为AMD迄今为止最大的云端胜利之一,标志着大型科技公司和AI企业算力竞赛的投资热潮持续 [10][13][20] 生态合作与行业格局 - 此次合作发生在AMD与OpenAI达成长期合作之后,OpenAI计划在未来几年通过多代AMD Instinct GPU部署总计约6吉瓦算力,初步阶段从2026下半年开始布置1吉瓦的MI450系列加速器 [15] - OpenAI将有权获得AMD高达约10%的股份,双方关系超越简单生意合作,更似战略结盟与资本绑定 [15] - Oracle与AMD的合作面向更广泛的OCI客户,与AMD-OpenAI计划并行不重叠 [15] - 随着Oracle在云端基础设施、OpenAI在AI应用层分别与AMD深化合作,一个贯通芯片、云平台、模型应用的新AI生态链正在形成 [20]