DONUT

搜索文档
Qcnet->SmartRefine->Donut:Argoverse v2上SOTA的进化之路~
自动驾驶之心· 2025-07-31 14:19
自动驾驶轨迹预测技术研究进展 - 论文DONUT基于decoder-only架构配合overprediction策略在argoversev2数据集上取得SOTA表现 [1] - SmartRefine和DONUT均以QCNet为基础进行改进并取得SOTA成绩 [1] QCNet关键技术分析 - 采用以查询为中心的场景编码范式,使模型表示独立于全局时空坐标系 [2] - 提出propose+refine两阶段轨迹解码范式,首先生成无锚query轨迹proposal,再基于锚点细化预测 [2] - 传统场景编码方式依赖当前时刻直角坐标系,无法复用历史计算特征 [3] - 创新性使用极坐标系表示agent状态,以位置为极点、heading vector为极轴 [5] - 采用傅里叶特征编码agent位移矢量、速度矢量等状态信息 [5] - 构建4D描述符表示agent间相对状态,包含距离、相对方向等要素 [6][7] - 地图元素处理分为polygon级别和点级别,类似VectorNet方法 [12][13] SmartRefine改进要点 - 对QCNet的refine部分进行改进,提出自适应anchor选择机制 [30] - 引入动态上下文获取范围机制,范围取决于迭代次数和agent速度 [31] - 提出anchor-centric上下文编码,将特征转换到锚点坐标系下 [34] - 采用循环多迭代细化策略,每条轨迹分为N个片段逐步优化 [35] - 创新性提出质量评分机制,实现自适应控制refine迭代次数 [38] DONUT模型创新 - 采用decoder-only架构,包含proposer和refiner两个核心模块 [40] - 引入overprediction机制,预测当前及下一子轨迹片段 [41] - 使用tokenizer对轨迹片段进行编码,结合MLP输出多模态概率 [43] - 在非ensembling模型中表现优异,与DeMo互有胜负 [48] - 消融实验显示decoder-only架构带来显著性能提升 [49] 行业技术发展趋势 - 自动驾驶技术社区快速发展,已建立近百个技术交流群 [51] - 行业关注重点包括大模型、端到端自动驾驶、BEV感知等前沿方向 [51] - 轨迹预测领域持续创新,QCNet及其改进模型推动技术进步 [1][30][40]