文章核心观点 - RISC-V RVA23 规范标志着CPU性能扩展方式的根本性转折,它将向量扩展(RVV)从可选加速器提升为软件可依赖的基础架构功能,从而终结了推测执行在处理器设计中的垄断地位[2][9] - 该转变将性能扩展的重心从依赖更深层、更复杂的推测执行机制,转向了结构化、显式的并行向量计算,为确定性、低功耗的设计方法开辟了道路[2][3][8] - 对于人工智能、机器学习等具有结构化、数据并行特征的工作负载,显式并行比推测性猜测更具优势,RVA23通过强制支持RVV确保了硬件对此类工作负载的优化支持[7][8] 根据相关目录分别进行总结 CPU架构设计范式的转变 - RVA23强制要求使用RISC-V向量扩展(RVV),使向量计算成为与标量执行地位平等的基础架构功能,而不再是附加的加速器[2] - 设计重心转移:硬件设计者不再被迫完全依赖更深层次的推测(如更大的分支预测器、更宽的重排序缓冲区)来保持竞争力,可以将面积和功耗转移到向量吞吐量和内存带宽上[3] - 这使得配备强大向量引擎的更简单的顺序执行内核,对于曾经需要复杂推测机制的工作负载变得可行[3] 推测执行的历史与成本 - 推测执行技术自20世纪60-70年代逐步发展,通过动态调度、乱序执行和分支预测等手段提升性能,但代价是增加了功耗、复杂性和安全风险[4] - 能源已成为计算主要制约因素:算术运算仅消耗几个皮焦耳,缓存访问成本高一个数量级,DRAM访问成本高出两到三个数量级,数据传输是能耗主因[5] - 现代CPU内存层次结构与推测执行协同演化,成为支撑大量不确定工作所需的框架,其存在是为了维持程序快速运行的假象,并在预测失败时进行清理[5][6] 确定性执行与向量计算的回归 - 确定性执行针对已知因素进行优化,将延迟视为可调度因素,而非需掩盖的问题,通过提高可预测性和持续吞吐量来提升性能[6] - 历史上,西摩·克雷的向量机完全摒弃推测,依赖可预测的内存步长、显式向量长度和确定性调度,其方法更接近RVV的结构化模型[6][7] - RVA23确保了硬件对AI、ML等结构化工作负载的支持,使结构化并行从可选扩展转变为架构基线,并未消除推测,但消除了其排他性[7][8] 对软件生态与硬件设计的影响 - 软件性能契约改变:编译器、库和应用程序现在可以假定每个兼容核心都存在RVV,优化策略从“让CPU猜测”转向显式、结构化的并行处理[3] - 工具链必须能可靠生成向量代码,数学和DSP库可以减少或消除标量回退,为应用程序开发人员提供了可预测的扩展模型[3] - 硬件实现者在微架构上仍有自由度(如通道宽度、流水线深度),但性能重心已改变,编译器基础设施和操作系统调度可以假定向量支持并进行相应优化[3][8] 行业意义与未来方向 - RVA23的意义在于指令编码之外:它强制要求了架构上的对等性,设计人员可以在适当时同时部署推测和向量架构,但结构化并行不再是次要选择[8] - 这终结了“非此即彼”的错误二元论,即不再认为必须通过推测架构扩展,否则就接受性能下降[8] - 该转变降低了向量运算能力的不确定性,减少了人们对确定性方法能否实现一流性能的疑虑,降低了对推测计算的扩展性依赖[9]
RISC-V迎来关键拐点
半导体行业观察·2026-03-05 09:13