对谈清华教授汪玉：为什么数据流架构适用智驾芯片？

文章核心观点 - 理想汽车自研的“马赫100”智驾芯片采用数据流架构，是行业内一项大胆且具有前瞻性的技术选择，旨在应对以VLA模型为代表的下一代智驾算法需求，并提升计算效率[3][5][8] - 数据流架构通过让数据在处理单元间直接流动，减少反复访问内存的开销，从而提升计算效率，但其编译难度较大，不过AI辅助编程和软硬件协同优化可以缓解此问题[5][6][9] - 车企自研芯片在成本可控、技术自主迭代以及软硬件垂直整合优化方面具有长期价值，尽管面临挑战，但若能持续迭代，其投入产出比是合理的[15] 技术路线：数据流架构的优劣势 - 优势：提升计算效率：数据流架构让数据在芯片处理单元间直接流动，减少了反复从外部存储器读取数据的开销，从而提升效率[5] - 优势：适合VLA模型：VLA模型包含视觉（算力密集型）、语言（内存密集型）和行动（计算模式不规律）三种运算，数据流架构能有效减少语言部分的内存访问开销，是支持此类持续演进智驾模型的不错选择[6][8] - 劣势：编译难度大：数据流架构的应用难点在于编译器的代价较大，但当前可利用AI技术辅助完成映射工作，甚至让算法适配底层架构[5][6] 芯片与算法演进趋势 - 架构趋于稳定：智驾模型的核心骨架（如Transformer及其变种）在未来几年内发生剧烈变化的可能性不大，因此一颗芯片有能力支持多代算法演进[11] - 软硬件协同优化：通过模型压缩、量化（如采用FP4、FP8而非FP32）以及内存调度优化，可以在固定算力下提升性能，这类似于在固定面积房间内用更多椅子替代沙发以容纳更多人[9][10] - 关键技术方向：未来3-5年，智驾芯片的关键演进方向包括采用Chiplet技术以突破单芯片面积限制并实现异构集成，以及通过内存堆叠（如3D堆叠）解决“存储墙”问题，让计算和存储更近[9][11] 车企自研芯片的逻辑与挑战 - 成本与可控性：车企自研芯片若能成功并持续迭代，将实现自主可控并降低成本[15] - 应对性能瓶颈：对于智驾乃至机器人应用，追求高实时性要求极高的Token处理速度，例如机器人可能需要每秒1000个Token的指挥控制频率，这需要性能强大的芯片支持[13][14] - 制程与能耗需求：汽车对先进制程芯片的需求同样迫切，并非因空间大而降低要求，先进制程有助于降低功耗、解决散热问题并提升性能，汽车电子系统占比已约30%，能耗是关键问题[15] - 生态壁垒可克服：智驾或大模型所需的计算算子数量（估计几百个）远少于英伟达CUDA生态为广泛通用计算所支持的数千个算子，且AI辅助编程降低了开发门槛，因此CUDA并非不可逾越的壁垒[16] 理想汽车的具体实践与行业定位 - 技术突破点：理想汽车的重要突破在于敢于采用VLA模型，并进一步选择数据流架构，这在行业内是领先的尝试[3][8] - 研发背景：理想于2022年启动芯片自研，在研发过程中预见到Transformer架构的潜力，其马赫100芯片以数据流架构为核心，同时兼容CNN等计算[13] - 垂直整合优势：类似苹果，理想具备将应用、软件、芯片与整车进行垂直整合优化的能力，这是其提升系统级性能的关键[15]