轨迹预测 - 财报，业绩电话会，研报，新闻

轨迹预测

搜索文档

自动驾驶之心· 2025-10-18 00:04

行业竞争格局演变 - 智能驾驶行业经历近两年洗牌后，牌桌已更换一批新玩家，但工业界对自动驾驶的投入持续加大，自动驾驶被视为AI核心技术及未来重点布局方向[1] - 行业在2022年之前处于蓬勃发展期，公司只要具备单一长板（如双目技术、硬件能力或AI能力）即可获得发展机会，但此后进入收缩期或平稳期，生存和发展的关键转变为补足短板[1] - 当前在赛道中活跃且表现良好的公司或主机厂，均在系统性地提升硬件、软件、AI能力及工程落地等综合实力，行业实践表明，只有成为“六边形战士”才能在未来竞争中存活并发展得更好[1] 2025年行业展望与人才需求 - 2025年行业将进入冷静期而非收敛期，L3、L4及Robotaxi等新赛道仍存在未解决的技术问题，这为所有参与者保留了机会[2] - 行业变革对个人而言是挑战更是机遇，能够留在行业内担当主力的均为技术栈丰富的综合型人才，抱有“捞一波”心态者将被淘汰，持续积累和构建壁垒是长期受用的策略[2] 自动驾驶之心知识星球社区概况 - 社区旨在解决初学者试错成本高、缺乏完整学习体系的问题，是一个集视频、图文、学习路线、问答、求职交流于一体的综合类自驾社区，目前成员已超过4000人，目标在未来2年内达到近万人规模[4] - 社区联合了众多学术界与工业界专家，内部梳理了超过40种技术路线，并邀请数十位活跃在一线的领域嘉宾答疑解惑，内容涵盖端到端入门、VLA学习路线、数据闭环工程实践等实用主题[4][6] - 社区成员背景多元，来自上海交大、北京大学、CMU、清华大学等国内外知名高校，以及蔚小理、地平线、华为、大疆等头部公司，形成了前沿技术聚集地[17] 社区资源与技术覆盖范围 - 社区汇总了近40个开源项目、近60个自动驾驶相关数据集及主流仿真平台，技术学习路线全面覆盖感知、规划控制、仿真、端到端、VLA等核心方向[18][35][37] - 针对热点技术领域如3DGS与NeRF、世界模型、视觉语言模型（VLM）、自动驾驶VLA、扩散模型、BEV感知等，社区均进行了详细的技术梳理和内容汇总[42][44][47][49][53][55] - 社区提供原创直播课程与系列视频教程，内容涵盖感知融合、多传感器标定、SLAM、决策规划、数据工程、端到端与大模型技术等，并建立了与多家自动驾驶公司的岗位内推机制[12][13] 社区互动与专业交流 - 社区内部定期与学术界、工业界专家畅聊技术趋势与量产痛点，并举办超过一百场专业直播分享，内容涉及VLA模型、V2X、3D检测、轨迹生成等前沿话题[7][92] - 成员可自由提问并获得解答，问题范围包括研究方向选择、就业前景分析、技术路线图求取以及企业内部推荐机会，形成了良好的学习交流与求职对接环境[6][21][94]

自动驾驶之心· 2025-08-19 11:35

端到端自动驾驶与轨迹预测技术 - 端到端自动驾驶量产应用仍较少多数公司沿用二段式端到端或模块化方法轨迹预测仍是量产主流算法 [1] - 轨迹预测模型与感知模型融合训练即构成端到端系统该领域研究热度持续会议期刊相关论文产出量大 [1] - 多智能体轨迹预测需处理历史轨迹数据预测未来运动应用于自动驾驶/智能监控/机器人导航面临行为不确定性和多模态挑战 [1] 扩散模型在轨迹预测中的应用突破 - 扩散模型通过逐步去噪生成复杂分布在轨迹预测中显著提升多模态建模能力 [2] - LeapfrogDiffusionModel采用可训练跳跃初始化器减少去噪步骤实现实时预测在NBA/NFL/SDD/ETHUCY数据集上精度提升19-30倍 [2] - MixedGaussianFlow构建混合高斯先验在UCY/ETH/SDD数据集达到最先进性能 [2] - PatternMemory-basedDiffusionModel通过聚类运动模式构建记忆库引导生成多样化合理轨迹 [2] 课程体系与科研目标 - 课程聚焦扩散模型多智能体轨迹预测包含12周科研+2周论文指导+10周维护期预期产出算法框架/定量分析/高水平论文 [3][9] - 覆盖轨迹预测技术发展史比较传统模型与生成式模型创新点包含LSTM/SocialPooling/Graph-basedmodel等经典方法解析 [24] - 重点解析LED/MGF/SingularTrajectory/MPMNet等先进算法涉及跳跃初始化/混合高斯先验/运动模式记忆等核心技术 [24] 技术资源支持 - 提供ETH/UCY/SDD等公开行人车辆轨迹数据集及预处理脚本 [20] - 开源LED/SingularTrajectory/MGF/MPMNet等基线代码框架供参考扩展 [21][22] - 必读论文包括CVPR2023跳跃扩散模型/NeurIPS2024混合高斯流等前沿成果 [23] 课程特色与学员收益 - "2+1"师资配置(教授+研究员+行业导师) 配备科研班主任全程督学 [16][17] - 学习周期包含学前测试/个性化指导/学术复习提供论文初稿/结业证书/推荐信等产出 [18][19] - 学员可掌握扩散模型条件控制/社会交互建模/多模态不确定性处理等高级技术 [24]

Intelligent Monitoring

Intelligent Monitoring

从顶会和量产方案来看，轨迹预测还有很多内容值得做......

自动驾驶之心· 2025-08-18 20:00

轨迹预测技术现状 - 轨迹预测仍是自动驾驶核心模块对下游规划控制至关重要可提前识别潜在危险并优化行驶路线[1] - 当前VLA方案不稳定多数量产仍依赖两阶段或类端到端架构轨迹预测模块不可或缺[1] - 学术界研究热度持续联合预测/多智能体预测/Diffusion模型等方向在顶会占据重要地位[1] 扩散模型技术突破 - 扩散模型通过逐步去噪实现复杂分布生成在轨迹预测中显著提升多模态建模能力[2] - Leapfrog Diffusion Model采用可训练跳跃初始化器在NBA/NFL等数据集上加速19-30倍[2] - Mixed Gaussian Flow构建混合高斯先验在UCY/ETH数据集达到SOTA性能[2][26] - MPMNet通过运动模式记忆库引导生成提升轨迹多样性与合理性[2] 课程技术框架 - 融合扩散生成机制与社会交互建模实现对目标点/环境因素的灵活控制[3][6] - 使用ETH/UCY/SDD等公开数据集验证对比LED/MGF等主流方法[3][24] - 提供预处理脚本与baseline代码包括LED/SingularTrajectory等开源框架[25] 课程体系设计 - 12周科研+2周论文指导+10周维护期覆盖选题/实验/写作全流程[12][35] - 包含CVPR/NeurIPS等顶会论文精讲如LED(CVPR 2023)/MGF(NeurIPS 2024)[26] - 采用"2+1"师资模式名校导师授课+科研班主任全程督导[18][19] 学员培养目标 - 系统掌握扩散模型轨迹预测理论形成完整知识体系[9] - 完成论文初稿产出获得写作/投稿方法论[13][30] - 硬件要求16GB内存+4GB显存GPU 需熟悉PyTorch框架[14][16] 教学实施方案 - 每周1-1.5小时专题课从经典LSTM到扩散模型进阶[27][28] - 阶段产出包括研究idea确定/代码实现/论文撰写[27] - 设置先导课与基础测试配备学术通识准备环节[22]

端到端离不开的轨迹预测，这个方向还有研究价值吗？

自动驾驶之心· 2025-08-16 08:03

自动驾驶轨迹预测研究现状 - 端到端方案尚未普及分层方案仍是主流轨迹预测作为核心算法持续受到关注[1] - 多智能体轨迹预测面临行为不确定性和多模态性挑战传统RNN/CNN/GNN方法存在局限[1] - 扩散模型在轨迹预测领域取得突破显著提升多模态建模能力如LED模型加速19-30倍[2] - MGF模型通过混合高斯先验优化多峰分布在UCY/ETH数据集达到SOTA性能[2] - MPMNet创新性引入人类运动模式记忆库增强轨迹生成的多样性[2] 课程技术框架 - 融合扩散生成机制与社会交互建模支持目标点和环境因素条件控制[3] - 采用ETH/UCY/SDD等标准数据集与LED/MGF等主流方法进行对比验证[3][20] - 提供预处理脚本和baseline代码包括LED/SingularTrajectory等开源框架[21][22] - 重点解析CVPR2023-2024前沿论文如跳跃扩散/混合高斯流等创新方法[23] 课程体系设计 - 12周科研+2周论文指导+10周维护期覆盖选题/实验/写作全流程[9][30] - 2+1师资配置名校教授+行业导师+科研班主任三重支持[16][17] - 前测-跟踪-反馈闭环机制配备学员表现评估体系[18] - 阶段产出包括论文初稿/结业证书/推荐信等学术成果[19] 教学实施细节 - 每周1-1.5小时课程包含经典方法/扩散模型/条件控制等14个模块[24][25] - 硬件要求16GB内存+4GB显存GPU 需掌握Python/PyTorch基础[12][15] - 强制完成课前阅读/作业/2小时课后自学全勤要求严格[15] - 提供基础先修课包含Linux开发/PyTorch调试等补充内容[14] 目标学员群体 - 本硕博学生及从业人员需提升轨迹预测/diffusion领域研究能力[8] - 申请留学或求职者需增强简历竞争力和论文产出[8] - 科研需求明确但缺乏系统方法需完整论文写作指导[6][9]

轨迹预测

扩散模型

Artificial Intelligence

基于扩散模型的多智能体轨迹预测方法

轨迹预测

扩散模型

Artificial Intelligence

基于扩散模型的多智能体轨迹预测方法

端到端盛行的当下，轨迹预测这个方向还有研究价值吗？

自动驾驶之心· 2025-08-12 16:05

端到端与轨迹预测研究价值 - 尽管端到端方案流行，但分层方案仍被广泛采用，轨迹预测作为核心算法仍是研究热点[1] - 行业持续关注联合轨迹预测和目标轨迹预测，相关学术会议和期刊保持高产出量[1] - 多智能体轨迹预测在自动驾驶、智能监控等领域具有关键应用价值，但面临行为不确定性和多模态性挑战[1] 扩散模型技术突破 - LeapfrogDiffusionModel(LED)采用可训练跳跃初始化器，实现19-30倍加速并在NBA/NFL等数据集提升精度[2] - MixedGaussianFlow(MGF)通过混合高斯先验匹配多峰分布，在UCY/ETH数据集达到SOTA性能[2] - MPMNet创新性使用运动模式记忆库引导扩散模型生成多样化轨迹[2] 课程技术体系 - 研究框架融合扩散生成机制、社会交互建模与条件控制机制[3] - 验证数据集覆盖ETH/UCY/SDD等主流基准，对比LED/MGF/SingularTrajectory等方法[3] - 预期产出包括算法框架、定量分析、可视化成果及高水平论文[3] 课程培养目标 - 构建轨迹预测知识体系，衔接理论知识与代码实践[6] - 提供论文创新思路到投稿的全流程支持，包含写作方法论与修稿指导[6] - 通过12周科研+2周论文指导+10周维护期实现论文初稿产出[9] 技术资源支持 - 提供ETH/UCY/SDD等预处理数据集及开源框架(LED/SingularTrajectory/MGF等)[20][21][22] - 重点论文覆盖CVPR 2023-2024最新成果，包括LED/MGF/MPMNet等创新模型[23] - 课程安排包含14周系统训练，涵盖扩散模型原理、社会交互建模到投稿全流程[24][25] 教学服务体系 - "2+1"师资配置(教授+行业导师+班主任)提供全周期学术支持[16][17] - 包含学前评估、个性化教学跟踪、学术复习等标准化流程[18] - 产出包含论文初稿、结业证书及推荐信(优秀学员)[19] 学员能力要求 - 需掌握Python/PyTorch及Linux开发基础，GPU配置要求16GB内存+4GB显存[10][12][15] - 学习强度要求每周1-2小时自学，按时完成作业并保持全勤[15] - 提供基础补齐课程(深度学习/PyTorch入门)支持零基础学员[14][26]

二段式SOTA！港科大FiM：从Planning的角度重新思考轨迹预测

自动驾驶之心· 2025-08-10 00:03

核心观点 - 提出"先推理，后预测"策略，从规划视角重构轨迹预测任务，显著提升预测置信度和准确性 [9][48] - 开发基于奖励驱动的意图推理器，结合QIRL框架实现可解释的行为意图推理 [6][9][24] - 引入Bi-Mamba增强的分层DETR-like解码器，有效捕捉轨迹序列依赖关系 [27][29][48] - 在Argoverse和nuScenes数据集上超越多个SOTA模型，minFDE6降低5-15% [34][36][38] 技术框架意图推理模块 - 采用网格级图表示场景布局，定义GRT作为离散决策序列 [5][17] - 基于MaxEnt IRL构建QIRL框架，学习参与者特定奖励分布 [6][14][23] - 通过策略rollout生成多模态GRT，提供意图先验指导 [24][26] - 辅助S-T OGM预测头建模未来交互，提升特征融合 [25][41] 轨迹解码架构 - 分层设计：首先生成无锚点轨迹提议，再进行基于锚点的优化 [26][27] - 双向Bi-Mamba结构处理轨迹序列，双向CLS token增强特征融合 [29][42] - 模态自注意力模块促进多模态交互，避免模态坍塌 [31][43] - 整体采用编码器-解码器结构，集成场景编码与轨迹生成 [18][20] 实验结果定量指标 - Argoverse1测试集：Brier score 0.5732（集成模型），优于HPNet(0.5912) [34][35] - Argoverse2验证集：minFDE6 0.528，长期监督版本(GRT-L)表现最佳 [36] - nuScenes数据集：minADE10 0.78，MR10 0.23，全面领先现有方法 [37][38] 消融研究 - 移除推理分支导致brier-minFDE6上升44%（2.879→1.602） [40] - Bi-Mamba比单向结构降低Brier score 1.5%（0.603→0.594） [42] - OGM模块贡献约6%的minFDE6提升（1.670→1.602） [40][41] 行业应用 - 验证了RL范式在驾驶行为建模的可行性，为VLA时代提供技术基线 [48][54] - 课程内容显示VLA算法工程师岗位薪资达40-70K，反映技术需求 [54][55] - 知识星球社区覆盖30+技术栈，4000+成员包含300+企业与机构 [59]

FiM（Foresight in Motion）

FiM（Foresight in Motion）

让机器人在人群中穿梭自如，港科广&港科大突破社交导航盲区 | ICRA 2025

量子位· 2025-04-01 12:11

社交导航技术 - 社交导航指在人机共存环境中，机器人遵循社会规范执行导航任务，需避免碰撞并保持合适社交距离[2][4] - 该技术面临两大核心挑战：预建地图方法难以适应动态密集环境，现有RL方法存在短视决策和依赖全局信息问题[5] - 香港科技大学团队提出Falcon算法，通过融入轨迹预测实现长期动态避障，显著提升导航性能[6][7] Falcon算法架构 - 采用双模块设计：主策略网络(MPN)负责行动决策，时空预知模块(SPM)增强环境动态预测能力[15][18] - MPN引入社会认知惩罚(SCP)机制，包含障碍物碰撞/人类接近/轨迹阻碍三重惩罚项[16][19] - SPM结合轨迹预测与辅助任务(人类数量估计/位置跟踪/未来轨迹预测)，仅在训练阶段使用[20][21][25] 数据集创新 - 现有基准存在场景简化(最大自然人类数仅3-7人)、人类行为失真等局限性[9][12][24] - 新建Social-HM3D(844场景)和Social-MP3D(72场景)数据集，支持6人交互，采用真实3D扫描和自然行为模拟[10][24][26] - 新数据集动态调整人群密度，支持物体导航/图像导航等下游任务扩展[28] 算法性能表现 - 在Social-HM3D达到55.15%成功率(SPL 55.15%)，未训练过的Social-MP3D仍保持55.05%成功率[29][30] - 社交合规性优异：个人空间合规性(PSC)接近90%，人机碰撞率约42%[31] - 对比实验中，Falcon显著优于A*(成功率46.14%)、ORCA(38.91%)等传统方法[32] 技术突破点 - 未来感知算法优势：相比静态路径规划和实时感知方法，能主动预测轨迹并提前调整路径[39][40] - 轨迹预测辅助任务效果最显著，使成功率从40.94%提升至54.00%[41][42] - SCP与SPM协同作用，完整模型性能从53.63%提升至55.15%，并加速训练收敛[44][45][46]