理想下一步的重点:从数据闭环到训练闭环
自动驾驶之心·2025-12-14 10:03

理想汽车智能驾驶技术发展路线 - 公司智能驾驶发展经历了四个阶段:规则时代的轻图和无图方案、基于AI的端到端(E2E)与视觉语言模型(VLM)快慢双系统、以及最新的VLA司机大模型 [6] - 在技术演进过程中,导航(Nav)模块是重点突出的部分 [6] 数据闭环的现状与能力 - 公司已建立完整的数据闭环流程:影子模式验证→数据触发回传→云端数据挖掘→自动标注→生成训练集训练模型→模型下发验证性能 [9] - 数据回传过程已能做到一分钟内完成 [10] - 公司目前积累了15亿公里的驾驶数据,并使用200多个触发器(Trigger)来生产15-45秒的片段(Clip)数据 [11] - 端到端量产版本的MPI(平均无干预行驶里程)已达到220公里以上,相比2024年7月底的版本提升了约19倍 [13] 数据闭环的局限与行业新阶段 - 仅靠数据闭环无法解决所有问题,尤其是长尾场景的收敛问题,例如交通管制、烟花燃放、突然变道等 [16] - 行业观点认为,自动驾驶已进入“下半场”,需要从“数据闭环”演进到“训练闭环” [18][21] 训练闭环的核心架构与关键技术 - L4级别训练循环的核心是VLA司机大模型、强化学习(RL)和世界模型(WM)的结合 [23] - 轨迹优化由VLA的扩散模型和基于世界模型的强化学习共同完成 [23] - 强化学习不仅包括RLHF,还扩展至RLVR和RLAIF [23] - 世界模型主要用于场景重建和新视角复原 [23] - 闭环自动驾驶训练的关键技术栈包括:区域级别的仿真、合成数据和强化学习 [24] 仿真与场景重建技术 - 仿真依赖于场景重建技术,包括:视觉/激光雷达重建、区域重建、多趟重建、场景编辑和风格迁移 [26] - 公司在重建方面已有两年工作积累,并发表了两篇顶会论文 [28] - 近期技术方案从重建发展到生成,例如Feedforward 3D高斯泼溅(3DGS)技术,无需点云初始化,可直接从视觉输入得到结果 [29] - 在联合重建与生成方面也有一篇顶会论文 [32] 合成数据生成与应用 - 合成数据依赖于多模态生成技术,包括:视频/点云生成和神经渲染 [26] - 公司在生成方面的工作已产出三篇顶会论文 [34] - 生成技术的应用涵盖场景编辑、场景迁移和场景生成 [36] - 公司在新的训练数据配比上做了大量工作 [38] 训练闭环的挑战与系统能力 - 可交互的智能体(Agent)是构建训练闭环的关键挑战 [40] - 系统能力是增强引擎的关键,包括:世界模型提供仿真环境、3D资产构建多样化场景、仿真智能体(SimAgents)进行交互式行为建模、奖励模型提供准确的反馈泛化能力、以及GPU工程加速推理 [41] 成果总结 - 公司在相关领域已取得成果并获得奖励 [45]

理想下一步的重点:从数据闭环到训练闭环 - Reportify