端到端自动驾驶技术发展 - 近半年端到端自动驾驶领域推荐度最高的10篇论文由深蓝AI调研数十位一线研究者得出,涵盖扩散模型、视觉语言模型等技术路线[2][20][22] - 理想汽车与中科院计算所、清华联合发布的TransDiffuser论文入选TOP2,采用扩散模型生成轨迹,PDMS得分达94.85[3][10][15] - 行业呈现技术融合趋势,包括3DGS强化学习框架、VLM知识蒸馏、车路协同等创新方向[27][45][63] TransDiffuser技术架构 - 采用编码器-解码器结构,场景编码器处理图像/LiDAR数据生成多模态特征,去噪解码器基于DDPM迭代生成轨迹[10][11] - 关键创新包括无锚点轨迹生成和多模态去相关优化机制,解决模式崩溃问题并提升轨迹多样性[16] - 使用NAVSIM数据集训练,输入8视角图像+5传感器LiDAR,输出8个路径点覆盖4秒轨迹[15] 理想汽车技术路径 - 理想VLA采用单系统架构,通过diffusion将action token解码为轨迹,相比VLM双系统具备更强语义理解能力[4][7] - 技术实现上先输出action token再生成轨迹,未直接输出控制信号,未来可能扩展至油门方向盘控制[4][5] - 采用ODE采样器优化使diffusion在2-3步内生成稳定轨迹,解决传统扩散模型效率低的问题[7] 行业技术标杆 - UniAD获得CVPR 2023最佳论文,首次整合感知预测规划任务到统一框架,成为行业基准[69] - VAD提出矢量化自动驾驶范式,通过实例级规划约束提升安全性,获ICCV 2023奖项[69] - 行业综述论文系统分析250+篇研究,梳理端到端自动驾驶的挑战与未来趋势[69] 前沿技术方向 - 3DGS强化学习框架RAD实现碰撞率降低3倍,开创基于3DGS的RL训练范式[27][30] - VLM-AD通过文本注释数据集提炼VLM知识,使碰撞率降低57.4%[29][32] - HiP-AD采用可变形注意力机制,在nuScenes数据集实现0.7%闭环碰撞率[55][61]
理想一篇论文入选近半年端到端自动驾驶推荐度最高的10篇论文