奔驰&图宾根联合新作!SpaceDrive:为自动驾驶VLA注入空间智能
自动驾驶之心·2025-12-19 13:46

点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 当前VLM在自动驾驶应用中面临两个根本性的系统缺陷,这限制了其作为通用驾驶Agent的上限 : 而现有VLM-based planner常常忽略了上述问题,或直接采用特定的 embedding/queries 针对某个任务进行训练来预测坐标,难以被迁移到上游推理或者其他任务中。 但是, Transformer架构本身的位置编码已经具备了处理token间位置关系的能力 ,这可以被视为 语义特征之间的空间关系 。受此启发,SpaceDrive通过 显式的、统 一的3D位置编码 替换文本数字token,将坐标的语言描述转换成可计算、可对齐、可被注意力直接使用的统一表示,从而提升了系统的空间推理和轨迹规划能力。 方法 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Peizheng Li等 编辑 | 自动驾驶之心 VLA凭借其强大的泛化能力和语义理解能力逐渐成为端到端自动驾驶新范式。然而,现有的基于2D VLM的驾驶系统在处理精细的3D空间关系时存在显著缺陷,而这 却是空间推理和轨迹规划的核心要求。 ...