Interaction Modelling in Autonomous Driving

搜索文档

自动驾驶之心· 2025-08-03 08:33

交互式规划技术框架 - 交互式规划本质上是一个世界模型用于描述自车与周围环境的动态交互关系[4] - 交互建模的核心在于推理其他交通参与者的未来行为涉及博弈论、POMDP和应变规划器等理论框架[5] - 典型方法包括基于预测模型的交互规划通过扰动自车轨迹增强条件预测(EC) 并构建轨迹树进行动态规划优化[6] TPP(Tree-structured Policy Planning)方法 - 通过构建自车轨迹树为每个分支生成预测场景树最后通过动态规划获得最优策略[6] - 损失函数包含三个部分：预测损失L_prediction(预测结果与GT的误差)、EC碰撞损失L_EC_collision(预测结果与自车轨迹的碰撞)、碰撞损失L_collision(交通参与者之间的碰撞)[9] - 其中L_EC_collision强制要求预测的交通参与者不能与自车轨迹发生碰撞体现了交互逻辑[9] IJP(Interactive Joint Planning)方法 - 采用基于同伦(homotopy)的轨迹采样方法将障碍物视为电流利用安培环路定律计算磁场线积分大幅减少采样数量[13][15] - 通过模型预测控制(MPC)联合优化自车和其他交通参与者轨迹线性约束条件考虑了自车与其他车辆之间的碰撞关系[16] - 计算延迟分析显示：预测部分耗时50ms(Nvidia 3090) SQP求解每条轨迹需300ms(构建150ms+求解150ms) 总延迟达1850ms[18] 实时性优化方案 - 采用ADMM(交替方向乘子法)替代SQP 将大规模优化问题分解为可组合的子问题在16个交通参与者情况下可达125Hz频率[19] - 嵌入式在线MPC技术可实现兆赫兹级别的优化速率满足实时性要求[19] DIPP(Differentiable Integrated Prediction and Planning)方法 - 采用可微分框架联合学习预测模型和规划代价函数的权重参数[21][22] - 损失函数包含多模态预测损失L_prediction、评分损失L_score、模仿损失L_imitation和代价损失L_cost[31] - 使用Transformer编码器处理交通参与者历史和地图信息通过可微非线性运动规划器进行优化[27][30] 技术挑战与局限性 - 预测导向方法存在反事实安全问题如主动汇入场景中预测与实际行为可能不一致[41] - 静态场景(如道路施工)中预测导向方法效果有限需要参数自动调整而非轨迹学习[44] - 真实标注数据存在不一致性问题驾驶员行为有时让行有时主动需要行为/轨迹聚类[41] 方法对比与应用前景 - TPP采用采样生成自车轨迹预测模型参数可学习代价权重人工设定[40] - IJP通过优化生成自车轨迹预测模型参数固定代价权重人工设定[40] - DIPP通过Transformer和优化器生成自车轨迹预测模型参数和代价权重均可学习[40] - 模块化框架(IJP)性能明确但依赖预测模型质量端到端框架(DIPP)性能不明确但值得探索[45] - 未来方向包括：Theseus库参数调优、联合优化解释性、Transformer交互建模可扩展性[45]

Autonomous Driving

Autonomous Driving Motion Planning

Interaction Modelling in Autonomous Driving

Autonomous Driving

Autonomous Driving Motion Planning