最强Arm CPU发布:192核,3nm工艺

亚马逊Graviton5芯片发布 - 亚马逊在re:invent大会上发布Graviton5,这是其迄今为止密度最高、性能最强的CPU,将192个处理器核心集成于单个插槽中,承诺将AWS性能提升至新水平 [1][3] - 自2018年首次推出以来,Graviton芯片已成为AWS计算服务的主力军,过去三年中,Graviton芯片的新增CPU容量占比超过一半 [1][3] Graviton5技术规格与性能 - 核心与工艺:Graviton5配备192个采用台积电3nm工艺制造的Arm Neoverse V3内核 [1][4] - 缓存系统:L3缓存容量从Graviton4的36MB大幅提升至192MB,增长5.3倍,每个核心的缓存容量从376KB提升至1MB [2][11] - 内存性能:芯片配备改进的内存子系统,速度提升至7200 MT/s,并正在开发对8800 MT/s DIMM的支持 [1][4] - 核心间延迟:更高的核心数量可有效降低核心间延迟约三分之一(33%),从而提升特定工作负载性能 [5][11] - 整体性能:基于Graviton5的新款M9g实例整体性能比基于Graviton4的M8g实例提升25% [3][5][11] - 核心密度:M9g实例拥有Amazon EC2中最高的CPU核心密度,单个实例包含192个核心 [11] 芯片设计与架构创新 - 核心数量跃升:从Graviton4的96个核心跃升至192个核心,这一重大提升可能得益于工艺节点微型化或Chiplet(芯粒)技术 [1][2][6] - 内存控制器:从Graviton3开始,内存控制器采用独立芯片设计并以芯粒形式集成,Graviton5至少在内存控制器领域应用了该技术 [2] - 单插槽设计:Graviton5将192个核心整合到单个插槽中,性能足以与AMD(192核)和Intel(144核)最高核心数的CPU相媲美 [3][5] - 互连与I/O:Graviton5将是首款开箱即支持PCIe 6的服务器CPU,与首款支持PCIe 5.0的Graviton3类似 [6] 系统集成与配套技术 - Nitro系统:Graviton5实例基于AWS Nitro系统构建,利用第六代Nitro卡将虚拟化、存储和网络功能卸载到专用硬件 [12] - 网络带宽:对于AWS M9g实例,Graviton5与定制的Nitro 6智能网卡配合,使网络带宽翻倍至100 Gbps [6] - 带宽提升:平均而言,各种实例大小的网络带宽提高15%,Amazon EBS带宽提高20%,最大实例的网络带宽提高一倍 [12] - 计算节点配置:实际计算节点包含两个插槽,并共享一个Nitro智能网卡 [6] 市场定位与客户反馈 - 设计理念:Graviton芯片旨在打造一款能够服务于多种角色、实现高利用率以降低成本的通用产品 [6] - 客户性能测试: - Airbnb测试发现其性能比同代其他系统架构提升高达25%,比Graviton4实例提升高达20% [14] - Atlassian在测试中观察到与上一代产品相比,性能提升30%,延迟降低20% [14] - 西门子数字化工业软件早期测试显示,Graviton5性能较Graviton4进一步提升了30% [15] - SAP在SAP HANA Cloud上观察到OLTP查询性能提升35%至60% [15] - Synopsys的早期测试结果显示,其EDA工具运行时间提升高达35%,VCS运行速度提升高达40% [15] 行业竞争格局 - 微软:发布了代号为Cobalt 200的第二代Arm CPU,基于Arm Neoverse V3,采用台积电3nm工艺,拥有132个活动核心,共享192 MB L3缓存 [8] - 谷歌:推出了Axion系列实例,每个实例最多配备72个Arm Neoverse V2核心,辅以576GB内存和100Gbps网络带宽 [8] - Oracle:运营着规模最大的基于Arm架构的Ampere CPU集群之一,发布了基于192核AmpereOne M处理器的实例 [9] 产品发布与路线图 - 实例发布:基于Graviton5的M9g通用实例已推出预览版 [7][15] - 未来计划:更多计算优化型(C9g)和内存优化型(R9g)实例计划于2026年发布 [7][15] - 全栈自研:亚马逊在最新的UltraServers AI机架系统中首次放弃了x86内核,转而采用包括Graviton、Trainium和Nitro在内的全套自研硅芯片 [7]