文章核心观点 - 文章通过分析AMD最新发布的技术文档,认为基于Zen 6架构的EPYC处理器(代号Venice)并非对Zen 5架构的根本性变革,而是一次侧重于效率提升和功能增强的迭代[1][4][18] - 文章驳斥了部分媒体关于Zen 6是“面向吞吐量的架构”并与Zen 5有显著差异的说法,认为两者在核心架构上具有高度延续性[3][10][18] - 根据性能监控计数器文档的详细对比,Zen 6的主要改进在于提供了更详细的性能监控能力、增强了对FP16计算的支持,并在调度器监控等方面进行了优化[11][15][18] 根据相关目录分别进行总结 Zen 6架构的首次披露与基本定位 - 2024年12月12日,AMD更新了技术文档,发布了关于“AMD Family 1Ah Model 50h-57h 处理器”的性能监视器计数器文档,文件名“69163-VenicePMC-pub.pdf”表明其指向代号为Venice的处理器,即基于Zen 6架构的EPYC处理器[1] - 该文档被认为是首份关于Zen 6内部配置的公开文件,尽管AMD尚未正式解释该处理器的具体信息[1] - 支持Zen 6架构的AMD μProf性能分析器工具预计将在下一个版本(如5.3版)中实现[2] Zen 6与Zen 5架构的对比分析 - 性能监控计数器的基础框架(如每个线程、L3复合体、数据结构的计数器数量及读取命令)在Zen 5和Zen 6中是共同的,没有变化[4] - 通用性能统计数据(如分支预测、各级缓存访问与命中率等)的对比显示,核心本身并无特别变化,主要区别在于Zen 6可以获取更详细的L1数据缓存填充来源信息[4] - 流水线利用率分析统计数据的对比显示,Zen 5和Zen 6在前端绑定、错误推测、后端绑定等核心指标的计算公式上基本一致[6][7] - 文档中关于Zen 5“总派遣槽位”的描述存在一处明显的拼写错误(描述为“一个周期内最多可以分派6条指令”,但公式为“8 * Event”),这与AMD官方图示中Zen 5前端末端显示的“Dispatch 8-wide”相符,证实Zen 5已是8路派遣[7][8] - 因此,部分媒体根据文档推测Zen 6将采用“八槽调度引擎”并据此认为其是“面向吞吐量的宽设计”,这一说法并不准确,因为Zen 5已经实现了8路解码与派遣结构,Zen 6在此方面并未发生显著变化[10][18] Zen 6架构的具体改进与新增功能 - 增强的FP16支持:性能计数器显示,Zen 6增加了对AVX512-FP16(打包FP16)以及FPU中标量FP16运算的支持,而Zen 5的相关计数器位在文档中被标记为“保留”[11] - 新增性能监控计数器:Zen 6引入了PMCx00F(用于监控512位打包操作,即AVX512操作)和PMCx013(用于监控非调度队列读取停顿)等新的性能监控计数器,这些在Zen 5的文档中未出现[13][14] - 更细粒度的调度监控:Zen 6的PMCx0AF(动态令牌调度停顿周期2)计数器可以分别监控整数调度器1-6以及Retire队列的令牌可用性,而Zen 5的对应计数器是统一处理所有调度组,这提供了更详细的调度器效率监控能力[15][16] - 指令缓存监控调整:Zen 6的文档中移除了Zen 5存在的PMCx18E(IC标签命中/未命中事件)计数器[14][18] 对Zen 6架构设计的整体评估 - 综合分析表明,Zen 6是Zen 5架构的改进版,而非设计策略的根本性改变[18] - 目前观察到的主要区别在于:Zen 6提供了更详细的性能计数器、FPU/AVX512增强了对FP16的支持,以及调度器监控的细化[18] - 文章推测,Zen 6的核心结构图将与Zen 5(文章中的图3)几乎相同,其发展重点是提升效率,例如改进x86指令到微操作的转换方法、优化调度技术或分支预测算法等[17][18] - 文章认为,AMD不太可能回归类似“推土机”架构那样以吞吐量为绝对核心的设计理念,因为当前AI工作负载对吞吐量的需求更倾向于通过专用加速器(如AMX)来解决,而非大幅调整CPU流水线[19]
关于AMD ZEN 6,一些看法