Workflow
轨迹预测
icon
搜索文档
二段式端到端新SOTA!港科大FiM:从Planning的角度重新思考轨迹预测(ICCV'25)
自动驾驶之心· 2025-07-26 21:30
核心观点 - 提出"先推理,后预测"策略,从规划视角重构轨迹预测任务,通过行为意图推理提升预测准确性和置信度 [4][11] - 开发奖励驱动意图推理器,结合以查询为中心的逆强化学习框架(QIRL)和最大熵逆强化学习(MaxEnt IRL) [8][14] - 设计分层DETR-like解码器集成双向选择性状态空间模型(Bi-Mamba),增强序列依赖关系捕捉能力 [9][26] - 在Argoverse和nuScenes数据集上实现SOTA性能,minFDE6指标达0.528-0.551,Brier分数0.594-0.629 [33][36] 技术框架 意图推理模块 - 采用网格级图表示场景布局,定义基于网格的推理遍历(GRT)作为意图序列 [5][19] - QIRL框架将向量化场景特征聚合为网格token,通过MaxEnt IRL推导奖励分布 [8][24] - 策略rollout生成多模态GRT序列,提取意图先验指导轨迹预测 [24][25] - 辅助时空占用网格图(OGM)预测头建模参与者未来交互,提升特征融合效果 [9][24] 轨迹解码架构 - 分层结构包含无锚点提议生成和基于锚点的优化两阶段 [25][26] - Bi-Mamba模型双向处理轨迹token,通过双CLS token实现前向-后向特征融合 [26][28] - 模态自注意力模块增强多模态预测,最终输出轨迹偏移量和概率分布 [26][28] - 消融实验验证Bi-Mamba比MLP基准提升brier-minFDE6达11.3% [40][43] 实验验证 定量结果 - Argoverse 1测试集:单模型brier-minFDE6 1.602,集成模型达1.131 [33][35] - Argoverse 2验证集:GRT-L变体minFDE6 0.528,优于DeMo(0.543)和QCNet(0.551) [34][36] - nuScenes数据集:超越当前所有排行榜模型,验证框架鲁棒性 [36] 消融分析 - 移除推理分支导致brier-minFDE6上升79.6%,验证意图推理关键作用 [37][38] - OGM模块贡献brier-minFDE6下降4.1%,优化模块贡献11.0% [39][40] - 双CLS token设计比单向Mamba提升分类精度3.2% [43][47] 行业应用 - 向量化表示结合Transformer架构成为自动驾驶轨迹预测主流技术路线 [12][19] - 强化学习范式在驾驶行为建模中展现潜力,为行业提供新研究基线 [47][55] - 长期意图监督(GRT-L)显著提升预测置信度,对量产系统具有实用价值 [34][35]
让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025
量子位· 2025-04-01 12:11
龚泽颖 投稿 量子位 | 公众号 QbitAI 机器人落地复杂场景,社交导航能力一定是避不开的关键一点。 先简单介绍下, 社交导航 (SocialNav,Social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。 就拿下图来说,机器人需导航至目标点,而目标恰好位于两名行人未来轨迹的交汇区域。 它 不仅要灵活避免潜在的碰撞风险,还需与行人保持合适的社交距离。 总而言之,社交导航该任务对视觉导航领域提出了独特挑战: 预建地图的方法难以适应人群密集的动态环境,而 现有RL方法存在短视决策和依赖全局信息的问题。 近期, 香港科技大学(广州)和香港科技大学联合提出了一种新算法, Falcon 。 它通过 将轨迹预测算法融入社交导航任务中 ,实现长期动态避障并提升导航性能。 Falcon算法框架由2个模块组成: 社交导航的 另一个重要挑战则是现有基准的真实性不足 。 如下所示,现有基准通常存在以下几方面的局限性: 针对上述局限性,研究团队 构建了两个新数据集——Social-HM3D 和 Social-MP3D ,作为社交导航任务的新基准。 该项目论文已被ICRA 2025接 ...