自动驾驶之心

搜索文档
端到端盛行的当下,轨迹预测这个方向还有研究价值吗?
自动驾驶之心· 2025-08-12 16:05
⼀、 端到端盛行的当下,轨迹预测这个方向还有研究价值吗? 最近有同学后台问我们,现在都是搞端到端了,前面的轨迹预测和规划控制还有啥研究的价值吗?端到端真的 上车的并不多,很多依然沿用分层方案,其中轨迹预测作为后半段的核心算法,依然是许多公司和机构研究的 热点。包括联合轨迹预测和目标轨迹预测。相关的会议和期刊依然有较大量的工作产出。 自动驾驶之心针对目前比较火的基于扩散模型的多智能体轨迹预测方法研究展开了首个1v6小班课!本课题聚 焦于"基于扩散模型的多智能体轨迹预测方法"。多智能体轨迹预测旨在根据多个交互主体的历史轨迹,预测其 未来运动轨迹,这在自动驾驶、智能监控和机器人导航等场景中至关重要。然而,由于人的行为具有不确定性 和多模态性,预测任务十分困难。传统方法通常依赖循环神经网络、卷积网络或图神经网络建模社会交互,而 生成模型(如GAN和CVAE)虽然可以模拟多模态分布,但效率不高。 扩散模型是一类通过逐步去噪实现复杂分布生成的新型模型,近年来在图像生成等领域取得了重大突破。研究 者发现将扩散模型应用于轨迹预测可以显著提升多模态建模能力。例如,LeapfrogDiffusionModel(LED)采 用可训 ...
自驾与AI方向研究生不断扩招,但顶会好像越来越普遍......
自动驾驶之心· 2025-08-12 16:05
1. 自身实力不够过硬 2. 导师精力资源没有倾斜给到 话又说回来,大导精力有限,对所带学生很难平均照顾,只能深入指导他最看重的几个学生。 于是 问题又绕回了自身实力这一块,如何打破循环,快速发一篇高质量论文? 跟随大佬套路,一年两篇论文不是问题! 自动驾驶之心服务大家的论文辅导正式推出了,联手全球 QS排名前100的老师,严格要求交付过程,不盲目招生,以诚信服务学生为主,近3年辅导学员超过 400+名,中稿率高达96%。 辅导全流程 明确需求与方向 → 精准选题与文献综述 → 创新方法设计与实验规划 → 严谨实验与深度分析 → 规范 写作与结构优化 → 多轮修改与反馈迭代 → 投稿选则与意见回复。 签订正规协议,保障你的研究想法、论文内容及个人隐私! 好消息: 2025年国内高校硕博扩招继续推进,自驾与人工智能等工科招生增幅普遍超过30%, 许多同学 成功在这个时候申上了硕/博士。 坏消息: 大厂面试人手2篇A会,未来就业不确定,毕业时间不确定,论文发表不确定,导师意见不 确定,实验结果不确定 ,竞争压力与就业压力与日俱增,时代的黑利也算是吃上了... 以上所有问题的根源说到底就是: 我们能帮你什么? 一直 ...
自动驾驶之心实习生招聘来了!
自动驾驶之心· 2025-08-12 07:33
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 大家好,我们是自动驾驶之心/具身智能/大模型之心Tech团队。非常高兴在这里和你相遇,如果你也认同技 术内容可以改变世界,那你可能就是我们在找的人! 我们在做什么? 我们希望通过技术内容连接学术界和工业界,成为企业和学校沟通的桥梁,更乃至数十万的AI开发者和创 业者。我们致力于为大家带来全网最新最权威的技术信息,团队聚焦在自动驾驶、具身智能、大模型等AI 最前沿的技术领域,涵盖学术论文解读、业内量产方案分析、大模型评测、商业动态、行业招聘、开源项 目等,并通过公众号、社群、视频号、知乎、小红书、B站等平台进行内容分享、粉丝交流及企业联系。 有技术背景,独立解读学术论文,运行部署开源项目和撰写代码demo; 1. 负责大模型/自动驾驶/具身智能等方向学术论文选题、解读和汇总; 2. 负责大模型/自动驾驶/具身智能方向知识星球的搭建; 3. 负责大模型/自动驾驶/具身智能的原创视频制作; 4. 负责原创稿件的撰写策划; 5. 推后管理和数据复盘; 2. 对技术相关的前沿进展和事件有极高的研究热情和分享欲; 3. ...
理想VLA的实质 | 强化学习占主导的下一个action token预测
自动驾驶之心· 2025-08-12 07:33
以下文章来源于理想TOP2 ,作者理想TOP2 理想TOP2 . 找对社群,深度交流理想长期基本面 作者 | 理想TOP2 来源 | 理想TOP2 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 以下为正文: Ilya是前OpenAI首席科学家,目前在做超级对齐的工作(如果不认为超级对齐非常重要,本质是不信AGI。) 最近十余年AI界多项最重要的变化由其推动。包括但不限于2012年和Hinton/Alex >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文核心分享四条逻辑链: 本文只做学术分享,如有侵权,联系删文 1. 对predict the next token不同的理解本质是对LLM或AI的潜力与实质有不同的理解。 本文架构: 2. 越认为predict the next token不只是概率分布/统计学的人,越容易认可LLM潜力很大/AI潜力很大/推理过程就是意识雏形甚至就是意识/超级对齐非常重要。 3. 不同时真正的深入思考AI与理想,很容易对理想所做之事含金量低估。 4. 理想的VLA实质是在强化学习占主导的连续predict the n ...
通用障碍物漏检,得升级下Occ自动标注模型了。。。
自动驾驶之心· 2025-08-12 07:33
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 通用障碍物自动标注怎么做? 小林是一名主机厂的云端模型算法工程师,工作已经四五年了。这两天接到了车端报的Case,恶劣天气倒在地上的树干漏检,行车时紧急刹停差点酿成事故。。。不 出意外,原因最后排查到数据的问题,要求数据团队紧急补充训练数据。 小林为难的挠了挠头,这种异常case也太难解决了。检测没办法解决这种异常的占用问题,标注数据也从未见过,看来只能靠OCC来做下兜底了。想到这里,小林觉得 需要精标一小批数据提供车端先使用,再配合挖掘大模型和云端模型的自动标注模型快速迭代数据量才能保证车端模型的泛化,看来又要有一段时间的苦日子 了。。。 自从2022年特斯拉宣布Occupancy Network上车以来,当下占用网络已经作为各家纯视觉智驾方案的标配。目前OCC作为行车和泊车中的重要感知模块,对训练数据的 标注需求也十分旺盛的,尤其是OCC需要更昂贵的点云标注,因此业内很多公司都在推进OCC的自动化标注,以期快速迭代模型的泛化性能。 简单来说,占用网络的目的将空间划分成小网格,预测每个网格的占用情况,解决异 ...
闭环碰撞率爆降50%!DistillDrive:异构多模态蒸馏端到端新方案
自动驾驶之心· 2025-08-12 07:33
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 今天自动驾驶之心为大家分享 华东理工大学、商汤研究院、悉尼大学 最新的工作! DistillDrive:异构蒸馏框架显著降低自动驾驶碰 撞率50% ! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与 技术交流群加入 ,也欢迎添加小助理微信AIDriver005 简介 端到端自动驾驶近年来取得了显著进展,这主要得益于感知技术和模仿学习的进步。如图1(b)所示,该方法直接从复杂的传感器输入学习到最终的规划和决 策,消除了中间的数据传递和目标表征过程,从而显著减少了级联误差。然而在闭环实验中,图1(a)中感知分离的规划模型表现优于端到端模型,这得益于其 论文链接:https://arxiv.org/abs/2508.05402 代码链接:https://github.com/YuruiAI/DistillDrive 对比学习和仿真实验。尽管如此,它在感知和规划之间面临着耦合障碍。 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Rui Yu等 编辑 | 自动驾驶之心 写在前面 & ...
本来决定去具身,现在有点犹豫了。。。
自动驾驶之心· 2025-08-11 20:17
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 具身智能无疑是今年最热的方向。从几年前的沉寂到去年的疯狂,再到25上半年开始逐渐冷静。大家慢慢回过神来,具身机器人还远远未到生产力的阶段。 (向峰哥和柱哥提问,欢迎加入『自动驾驶之心知识星球』) 以下是知识星球内部一位双非同学的提问,非常有代表性: 各位大佬们好,我目前是一个双非的研究生,我的研究方向是多传感器融合定位的,然后学过python,深度学习,ros,但都学的不是很精,现在想多学一点为 以后找工作用,感觉算法岗我的学历可能不太行,请问各位大佬们我应该往哪个方向学比较好呢?具身智能感觉也还不太成熟,不确定这波热度能到什么时 候?请问各位大佬后面应该学些什么知识呢? 星主回答:你的技术栈都比较偏机器人一些,SLAM和ROS这块都可以尝试一下和机器人/具身智能打交道。这块需求也比较大,可以做一些优化、集成类工作~另 一方面,我们了解到大一些的公司各家的hc都不是很高,要求基本上都是端到端、大模型、VLA、强化学习、3DGS这些比较前沿的方向。如果你做的是这块,是 有机会的,很多tire 1的公司或者主机厂 ...
世界机器人大会引爆3D视觉革命,空间智能成焦点~
自动驾驶之心· 2025-08-11 13:45
三维重建技术进化,激光扫描仪开启机器人"全地形时代" 2025世界机器人大会(WRC)正在北京如火如荼地进行,三维感知技术成为全场核心亮点!深圳留形科技首发 全球首款千元级空间记忆模组MindPalace Odin1,观众站定数秒即可生成实时三维点云模型,融合多模态传感器 与自研MindSLAM算法,精准还原人体姿态与复杂环境结构。帕西尼推出的第三代多维触觉传感器矩阵PX-6AX- GEN3,以每秒百万次采样频率输出15维力觉数据,让机器人"触觉"细腻如人类指尖。而奥比中光发布的Pulsar ME450 3D激光雷达与Gemini 345Lg双目相机,更以超宽温域、抗干扰性能,为户外机器人装上"穿透迷雾的眼 睛"。这些技术共同指向一个趋势:三维重建正从实验室走向千行百业,成为机器人感知世界的"新基建"。 三维重建技术的终极目标,是让机器人在任意场景中"看得懂、走得通、搞得定"。最新手持激光扫描仪如D- H100,已实现120米超远距厘米级精度扫描,搭载LiDAR SLAM与双频GNSS天线,无需标记点即可在矿山、密 林、地下隧道等复杂环境中实时输出高精度点云。这类设备轻至1.83kg,开机即扫、边走边建,效率 ...
基于扩散模型的多智能体轨迹预测方法1v6小班课来了!
自动驾驶之心· 2025-08-11 13:45
⼀、课题简介⭐ 基于扩散模型的多智能体轨迹预测方法研究来啦!本课题聚焦于"基于扩散模型的多智能体轨迹预测方法"。多 智能体轨迹预测旨在根据多个交互主体的历史轨迹,预测其未来运动轨迹,这在自动驾驶、智能监控和机器人 导航等场景中至关重要。然而,由于人的行为具有不确定性和多模态性,预测任务十分困难。传统方法通常依 赖循环神经网络、卷积网络或图神经网络建模社会交互,而生成模型(如GAN和CVAE)虽然可以模拟多模态 分布,但效率不高。 扩散模型是一类通过逐步去噪实现复杂分布生成的新型模型,近年来在图像生成等领域取得了重大突破。研究 者发现将扩散模型应用于轨迹预测可以显著提升多模态建模能力。例如,LeapfrogDiffusionModel(LED)采 用可训练的"跳跃"初始化器,减少去噪步骤并实现实时预测,在NBA/NFL/SDD/ETHUCY等数据集上显著提升 精度并加速了19–30倍。MixedGaussianFlow(MGF)通过构建混合高斯先验来更好地匹配未来轨迹的多峰分 布,在UCY/ETH和SDD数据集上达到了最先进性能。此外,Pattern Memory-based Diffusion Model ( ...
大模型微调到底有没有技术含量,或者说技术含量到底有多大?
自动驾驶之心· 2025-08-11 07:32
以下文章来源于刘聪NLP ,作者ybq 刘聪NLP . 不会rap的刘聪,在这里分享着AI的flow。 作者 | ybq 编辑 | 自动驾驶之心 原文链接: https://www.zhihu.com/question/599396505/answer/3583853852 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 做法 1 : 继承实验室或者同事的训练数据,拿到之后也不 check 一下数据质量,直接放进去训。 做法 2 : 下载一个开源数据,构建"system + query + answer"集合。 做法 3 : 利用 gpt4 生成数据,学会用 gpt4 喜好的 prompt 去请求。并且意识到数据 prompt 多样性,想尽各种办法去扩充 prompt 的任务多样性和表达方式多样性, 甚至去刻意加一些 noisy prompt 去提升抗噪性。同时,愿意放下身架,一条一条去 check 数据质量,去和标注同学对齐标注标准。 做法 4 : 利用用户的交互日志来驱动数据构造过程,收集用户的真实 ...