对谈清华教授汪玉:为什么数据流架构适用智驾芯片?

文章核心观点 - 理想汽车自研的“马赫100”智驾芯片采用数据流架构,是行业内一项大胆且具有前瞻性的技术选择,旨在应对以VLA模型为代表的下一代智驾算法需求,并提升计算效率[3][5][8] - 数据流架构通过让数据在处理单元间直接流动,减少反复访问内存的开销,从而提升计算效率,但其编译难度较大,不过AI辅助编程和软硬件协同优化可以缓解此问题[5][6][9] - 车企自研芯片在成本可控、技术自主迭代以及软硬件垂直整合优化方面具有长期价值,尽管面临挑战,但若能持续迭代,其投入产出比是合理的[15] 技术路线:数据流架构的优劣势 - 优势:提升计算效率:数据流架构让数据在芯片处理单元间直接流动,减少了反复从外部存储器读取数据的开销,从而提升效率[5] - 优势:适合VLA模型:VLA模型包含视觉(算力密集型)、语言(内存密集型)和行动(计算模式不规律)三种运算,数据流架构能有效减少语言部分的内存访问开销,是支持此类持续演进智驾模型的不错选择[6][8] - 劣势:编译难度大:数据流架构的应用难点在于编译器的代价较大,但当前可利用AI技术辅助完成映射工作,甚至让算法适配底层架构[5][6] 芯片与算法演进趋势 - 架构趋于稳定:智驾模型的核心骨架(如Transformer及其变种)在未来几年内发生剧烈变化的可能性不大,因此一颗芯片有能力支持多代算法演进[11] - 软硬件协同优化:通过模型压缩、量化(如采用FP4、FP8而非FP32)以及内存调度优化,可以在固定算力下提升性能,这类似于在固定面积房间内用更多椅子替代沙发以容纳更多人[9][10] - 关键技术方向:未来3-5年,智驾芯片的关键演进方向包括采用Chiplet技术以突破单芯片面积限制并实现异构集成,以及通过内存堆叠(如3D堆叠)解决“存储墙”问题,让计算和存储更近[9][11] 车企自研芯片的逻辑与挑战 - 成本与可控性:车企自研芯片若能成功并持续迭代,将实现自主可控并降低成本[15] - 应对性能瓶颈:对于智驾乃至机器人应用,追求高实时性要求极高的Token处理速度,例如机器人可能需要每秒1000个Token的指挥控制频率,这需要性能强大的芯片支持[13][14] - 制程与能耗需求:汽车对先进制程芯片的需求同样迫切,并非因空间大而降低要求,先进制程有助于降低功耗、解决散热问题并提升性能,汽车电子系统占比已约30%,能耗是关键问题[15] - 生态壁垒可克服:智驾或大模型所需的计算算子数量(估计几百个)远少于英伟达CUDA生态为广泛通用计算所支持的数千个算子,且AI辅助编程降低了开发门槛,因此CUDA并非不可逾越的壁垒[16] 理想汽车的具体实践与行业定位 - 技术突破点:理想汽车的重要突破在于敢于采用VLA模型,并进一步选择数据流架构,这在行业内是领先的尝试[3][8] - 研发背景:理想于2022年启动芯片自研,在研发过程中预见到Transformer架构的潜力,其马赫100芯片以数据流架构为核心,同时兼容CNN等计算[13] - 垂直整合优势:类似苹果,理想具备将应用、软件、芯片与整车进行垂直整合优化的能力,这是其提升系统级性能的关键[15]

对谈清华教授汪玉:为什么数据流架构适用智驾芯片? - Reportify