Workflow
CPU基准测试
icon
搜索文档
SPEC CPU 2026发布,更新了什么?
半导体行业观察· 2026-05-06 09:38
SPEC CPU 2026基准测试套件发布 - 标准性能评估公司(SPEC)发布了全新的SPEC CPU 2026基准测试套件,这是九年来的首次重大更新,旨在全面升级CPU基准测试,成为未来十年衡量CPU性能最重要的工具之一 [1][2] SPEC CPU基准测试的重要性与设计 - SPEC CPU是SPEC首个基准测试套件,自1989年发布以来,因其可移植性(以源代码形式分发)和广泛适用性(从服务器到移动设备),已成为比较不同CPU架构性能、能效和IPC的主要工具 [8][10] - 该基准测试的设计目标是专注于CPU和内存子系统性能,通过避免文件I/O、确保确定性操作、最小化操作系统影响(目标95%执行时间在用户空间)来减少其他瓶颈,其工作负载代表现代计算机实际应用场景 [11][14] - SPEC CPU 2026包含52个基准测试,覆盖编程/编译、媒体、人工智能、电子设计、网络、数据库和计算科学等广泛领域,代码总行数从约710万行增加到约1670万行,工作量大幅增加 [14][20] SPEC CPU 2026的主要更新内容 - 套件中大部分基准测试被弃用,38个为全新测试项目,仅保留14个2016版测试项目(如GCC、LLVM)并进行了更新,移除了Perl、x264等,新增了CPython、FLAC、SQLite、FPGA布局布线(VPR)等工作负载 [2][20] - 基准测试套件更新了语言标准,从C99、C++03、Fortran 2003升级至C18、C++17、Fortran 2018,支持C++线程和Fortran并发等新特性 [24][25] - 硬件要求显著提高,SPECrate每个实例仍需2GB内存,但SPECspeed内存需求跃升至64GB,一台现代高端桌面CPU运行SPECrate可能需要64GB内存,测试中一台配备128GB内存的AMD Ryzen Threadripper 9980X系统也因内存不足而运行失败 [28] - 参考处理器更换为联想ThinkSystem HR330A,搭载3.0GHz的Ampere eMAG 8180处理器(32核ARMv8,2018年发布),结束了SPARC处理器的长期历史 [29] 初步性能测试结果(基于三款系统) - 测试系统包括戴尔(Intel Core 9 Ultra 285HX)、GMKtec(AMD Ryzen AI Max+ 395)和NVIDIA DGX Spark(NVIDIA GB10),均配备128GB内存,使用LLVM 20.1.8编译器测试基础性能 [30][32] - 单实例(1T)SPECrate测试中,NVIDIA GB10的Arm Cortex-X925核心表现最佳,性能约为2018年参考机器的5.5倍,在整数和浮点工作负载上比第二快的AMD平台高出约10%,两款x86系统性能接近 [34] - 在能效核心(E核心)对比中,Intel 285HX的Skymont E核心性能达到其Lion Cove P核心的80%左右,而NVIDIA的Cortex-A725核心性能仅为Cortex-X925核心的45%到50% [34] - 满负荷运行(多实例)SPECrate测试时,结果逆转:AMD Zen 5系统在整数和浮点运算测试中均优于Intel和NVIDIA/Arm系统,尽管其核心数较少(16个P核心),但凭借同构设计在多线程吞吐量上领先 [44][53] - 具体基准测试得分显示,AMD系统在几乎所有整数测试和多数浮点测试中胜出或领先,仅在个别测试(如782.lbm_r)中表现不佳 [47][50] SPEC CPU 2026与2017版性能对比 - 对比单实例性能,SPEC CPU 2026的得分普遍低于2017版:三款系统的整数得分降至2017年的55%到58%,浮点得分下降更明显,Intel系统降至54%,NVIDIA Arm系统降至46% [59] - 对比多实例吞吐性能,下降比例相对稳定,所有结果均在50%左右,NVIDIA Arm系统在2026浮点速率测试中达到其2017年性能的52% [61][62] - 尽管得分绝对值变化,但测试的三款芯片(Intel Arrow Lake、AMD Strix Halo、NVIDIA GB10)在2026版中的相对排名与2017版相比基本保持不变,新套件未显著改变现有CPU性能对比格局 [62][65] 行业参与与影响 - SPEC CPU基准测试由包括AMD、Intel、Arm和SiFive等CPU领域巨头的团队持续开发,广泛的行业参与提升了其合法性和认可度,被视为公平的基准测试 [3] - 新基准测试套件的发布正值业界设计和评估未来十年CPU之际,其更现代、更全面的工作负载为比较芯片性能提供了更多有价值的数据点,尽管目前未改变市场排名,但为长期评估奠定了基础 [66]