RISC-V迎来关键拐点

文章核心观点 - RISC-V RVA23 规范标志着CPU性能扩展方式的根本性转折，它将向量扩展(RVV)从可选加速器提升为软件可依赖的基础架构功能，从而终结了推测执行在处理器设计中的垄断地位[2][9] - 该转变将性能扩展的重心从依赖更深层、更复杂的推测执行机制，转向了结构化、显式的并行向量计算，为确定性、低功耗的设计方法开辟了道路[2][3][8] - 对于人工智能、机器学习等具有结构化、数据并行特征的工作负载，显式并行比推测性猜测更具优势，RVA23通过强制支持RVV确保了硬件对此类工作负载的优化支持[7][8] 根据相关目录分别进行总结 CPU架构设计范式的转变 - RVA23强制要求使用RISC-V向量扩展(RVV)，使向量计算成为与标量执行地位平等的基础架构功能，而不再是附加的加速器[2] - 设计重心转移：硬件设计者不再被迫完全依赖更深层次的推测（如更大的分支预测器、更宽的重排序缓冲区）来保持竞争力，可以将面积和功耗转移到向量吞吐量和内存带宽上[3] - 这使得配备强大向量引擎的更简单的顺序执行内核，对于曾经需要复杂推测机制的工作负载变得可行[3] 推测执行的历史与成本 - 推测执行技术自20世纪60-70年代逐步发展，通过动态调度、乱序执行和分支预测等手段提升性能，但代价是增加了功耗、复杂性和安全风险[4] - 能源已成为计算主要制约因素：算术运算仅消耗几个皮焦耳，缓存访问成本高一个数量级，DRAM访问成本高出两到三个数量级，数据传输是能耗主因[5] - 现代CPU内存层次结构与推测执行协同演化，成为支撑大量不确定工作所需的框架，其存在是为了维持程序快速运行的假象，并在预测失败时进行清理[5][6] 确定性执行与向量计算的回归 - 确定性执行针对已知因素进行优化，将延迟视为可调度因素，而非需掩盖的问题，通过提高可预测性和持续吞吐量来提升性能[6] - 历史上，西摩·克雷的向量机完全摒弃推测，依赖可预测的内存步长、显式向量长度和确定性调度，其方法更接近RVV的结构化模型[6][7] - RVA23确保了硬件对AI、ML等结构化工作负载的支持，使结构化并行从可选扩展转变为架构基线，并未消除推测，但消除了其排他性[7][8] 对软件生态与硬件设计的影响 - 软件性能契约改变：编译器、库和应用程序现在可以假定每个兼容核心都存在RVV，优化策略从“让CPU猜测”转向显式、结构化的并行处理[3] - 工具链必须能可靠生成向量代码，数学和DSP库可以减少或消除标量回退，为应用程序开发人员提供了可预测的扩展模型[3] - 硬件实现者在微架构上仍有自由度（如通道宽度、流水线深度），但性能重心已改变，编译器基础设施和操作系统调度可以假定向量支持并进行相应优化[3][8] 行业意义与未来方向 - RVA23的意义在于指令编码之外：它强制要求了架构上的对等性，设计人员可以在适当时同时部署推测和向量架构，但结构化并行不再是次要选择[8] - 这终结了“非此即彼”的错误二元论，即不再认为必须通过推测架构扩展，否则就接受性能下降[8] - 该转变降低了向量运算能力的不确定性，减少了人们对确定性方法能否实现一流性能的疑虑，降低了对推测计算的扩展性依赖[9]