Interaction Modelling in Autonomous Driving

搜索文档
自动驾驶运动规划(motion planning)发展到了什么阶段?
自动驾驶之心· 2025-08-03 08:33
交互式规划技术框架 - 交互式规划本质上是一个世界模型 用于描述自车与周围环境的动态交互关系[4] - 交互建模的核心在于推理其他交通参与者的未来行为 涉及博弈论、POMDP和应变规划器等理论框架[5] - 典型方法包括基于预测模型的交互规划 通过扰动自车轨迹增强条件预测(EC) 并构建轨迹树进行动态规划优化[6] TPP(Tree-structured Policy Planning)方法 - 通过构建自车轨迹树 为每个分支生成预测场景树 最后通过动态规划获得最优策略[6] - 损失函数包含三个部分:预测损失L_prediction(预测结果与GT的误差)、EC碰撞损失L_EC_collision(预测结果与自车轨迹的碰撞)、碰撞损失L_collision(交通参与者之间的碰撞)[9] - 其中L_EC_collision强制要求预测的交通参与者不能与自车轨迹发生碰撞 体现了交互逻辑[9] IJP(Interactive Joint Planning)方法 - 采用基于同伦(homotopy)的轨迹采样方法 将障碍物视为电流 利用安培环路定律计算磁场线积分 大幅减少采样数量[13][15] - 通过模型预测控制(MPC)联合优化自车和其他交通参与者轨迹 线性约束条件考虑了自车与其他车辆之间的碰撞关系[16] - 计算延迟分析显示:预测部分耗时50ms(Nvidia 3090) SQP求解每条轨迹需300ms(构建150ms+求解150ms) 总延迟达1850ms[18] 实时性优化方案 - 采用ADMM(交替方向乘子法)替代SQP 将大规模优化问题分解为可组合的子问题 在16个交通参与者情况下可达125Hz频率[19] - 嵌入式在线MPC技术可实现兆赫兹级别的优化速率 满足实时性要求[19] DIPP(Differentiable Integrated Prediction and Planning)方法 - 采用可微分框架 联合学习预测模型和规划代价函数的权重参数[21][22] - 损失函数包含多模态预测损失L_prediction、评分损失L_score、模仿损失L_imitation和代价损失L_cost[31] - 使用Transformer编码器处理交通参与者历史和地图信息 通过可微非线性运动规划器进行优化[27][30] 技术挑战与局限性 - 预测导向方法存在反事实安全问题 如主动汇入场景中预测与实际行为可能不一致[41] - 静态场景(如道路施工)中预测导向方法效果有限 需要参数自动调整而非轨迹学习[44] - 真实标注数据存在不一致性问题 驾驶员行为有时让行有时主动 需要行为/轨迹聚类[41] 方法对比与应用前景 - TPP采用采样生成自车轨迹 预测模型参数可学习 代价权重人工设定[40] - IJP通过优化生成自车轨迹 预测模型参数固定 代价权重人工设定[40] - DIPP通过Transformer和优化器生成自车轨迹 预测模型参数和代价权重均可学习[40] - 模块化框架(IJP)性能明确但依赖预测模型质量 端到端框架(DIPP)性能不明确但值得探索[45] - 未来方向包括:Theseus库参数调优、联合优化解释性、Transformer交互建模可扩展性[45]