Workflow
自动驾驶之心
icon
搜索文档
2025年,找工作有些迷茫。。。
自动驾驶之心· 2025-06-28 21:34
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 AutoRobo知识星球 这是一个给自动驾驶、具身智能、机器人方向同学求职交流的地方,目前近1000名成员了,成员范围包 含已经工作的社招同学,如地平线、理想汽车、华为、小米汽车、momenta、元戎启行等公司。同时也 包含2024年秋招、2025年秋招的小伙伴,方向涉及自动驾驶与具身智能绝大领域。 这几年以自动驾驶和具身智能为主线的AI技术不断突破,撑起了近一半的技术路线和融资金额。从 L2~L4自动驾驶功能的不断量产到人形机器人完成跳舞、四足机械狗在沙漠与丛林跳跃。很幸运能够完 整的经历这一发展周期,我们非常清晰行业对技术和人才的需求。 星球内部有哪些内容?这一点结合我们已有的优势,给大家汇总了面试题目、面经、行业研报、谈薪技 巧、还有各类内推公司、简历优化建议服务。 招聘信息 做了3年多的技术自媒体,在自驾、具身智能、3D视觉、机器人领域,我们沉淀了大量的内容。但后期陆 续收到了许多同学关于就业的求助,谈薪、避坑、职位选择、跨行等都是大家很关注的问题。我们一直 想给大家这样一个平台,让需要就业的同学能够 ...
放榜了!ICCV 2025最新汇总(自驾/具身/3D视觉/LLM/CV等)
自动驾驶之心· 2025-06-28 21:34
Epona: Autoregressive Diffusion World Model for Autonomous Driving SynthDrive: Scalable Real2Sim2RealSensor Simulation Pipeline for High-Fidelity Asset Generation and Driving DataSynthesis 这次ICCV很热闹啊!ICCV25放榜了,陆续有工作放出。自动驾驶之心也给大家盘点下这次中稿的一些工作! 注:部分工作前期已经来到我们自动驾驶之心知识星球做过分享。更多内容欢迎扫码加入我们的自驾社区,第 一时间掌握所有动态。 【视频+解析】 DriveArena: A Controllable Generative Simulation Platform for Autonomous Driving Boost 3D Reconstruction using Diffusion-based Intrinsic Estimation StableDepth:Scene-Consistent andScale-Invariant Monocu ...
中科院&字节提出BridgeVLA!斩获CVPR 2025 workshop冠军~
自动驾驶之心· 2025-06-28 21:34
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 只需要三条轨迹,就能取得 96.8% 的成功率?视觉干扰、任务组合等泛化场景都能轻松拿捏?或许, 3D VLA 操作新范式已经到来。 当前,接收 2D 图像进行 Next Action Token 预测的「2D VLA」模型已经展现出了实现通用机器人 操作的潜力;同时,接受 3D 信息作为输入,并以下一时刻的关键帧作为输出的「3D 操作策略」已被 证明拥有极高的数据效率(≈10 条操作轨迹)。 那么,直觉上来讲,一个好的「3D VLA」模型应该能够综合以上的优点,兼具 efficient 和 effective 的特点。然而,当前 3D VLA 的模型设计并未实现上述期待。 为了解决上述问题,中科院自动化所谭铁牛团队联合字节跳动 Seed 推出 BridgeVLA,展示了一种全 新的 3D VLA 范式,实现了 模 型 能 力 与 数 据 效 率 的 同 步 飞 跃 , 并 斩 获 了 CVPR 2025 GRAIL workshop 的 COLOSSEUM Challenge 冠军。 目前代码与数据已经全面 ...
何恺明CVPR 2025报告深度解读:生成模型如何迈向端到端?
自动驾驶之心· 2025-06-28 21:34
点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我 -> 领取大模型巨卷干货 写在前面 在深度学习的历史长河中,AlexNet的横空出世曾彻底改写识别模型的命运——它让"逐层训练"成为过去式,端到端学 习从此一统江湖。而今天,当我们望向生成模型的浩瀚星空,扩散模型的多步迭代、自回归模型的时序依赖,是否仍 在重演"前AlexNet时代"的困局? 何恺明老师在 CVPR 2025 workshop上的最新分享 《Towards End-to-End Generative Modeling》 ,正以手术刀般的视 角剖开这场技术演进的历史轮回。他不仅回溯了识别与生成的"硬币双面"关系——一边是数据到语义的抽象流,一边 是噪声到实例的具象流,更带来了MeanFlow这把"瑞士军刀":用平均速度替代复杂积分,让ImageNet生成从250步迭 代压缩到1步完成,FID指标直逼传统多步模型的天花板。 这不禁让人思考:生成模型的"AlexNet时刻"是否已至? 今天,就让我们以何恺明老师的报告为锚点, 回顾 一下生成模型技术丛林的深度漫游,解锁那些正在重塑生成模型范 式的关键思想。 此外,借着这个话题,我们也同步 ...
之心急聘!25年业务合伙人招聘,量大管饱~
自动驾驶之心· 2025-06-27 17:34
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 业务合伙人 你好啊,我们是自动驾驶之心。很开心你能点进来!如果你也认同内容可以改变世界,那你可能就是我们 在找的人! 如果您是大模型/多模态大模型、扩散模型、VLA、端到端、具身交互、联合预测、SLAM、3D目标检测、 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向,欢迎加入我们; 岗位要求 QS200以内高校,硕士及以上学历,手握顶会的大佬优先。 待遇说明 自动驾驶资源共享(求职、读博、出国留学推荐等); 自动驾驶之心业务合伙人招募来啦!我们团队今年计划向国内外招募10名优秀的合伙人,负责自动驾驶相 关课程研发、论文辅导业务开发、硬件研发; 主要方向 丰厚的现金激励; 创业项目合作与推荐; 联系我们 更多欢迎添加微信咨询,备注" 机构/公司 + 自动驾驶合作咨询 "。 ...
商汤绝影世界模型负责人离职。。。
自动驾驶之心· 2025-06-27 17:15
据悉,商汤绝影的世界模型研发负责人离职。据了解其负责商汤绝影云端技术体系建设,也是绝影的生 成式智驾方案R-UniAD的研发负责人。 以下文章来源于红色星际 ,作者红色星际科技 红色星际 . 让更多人,更深入地了解自动驾驶行业! 来源 | 红色星际 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>点击进入→ 自动驾驶之心 『行业第一线』技术交流群 本文只做学术分享,如有侵权,联系删文 传闻该负责人离职之后有可能去创业。 25年对于商汤绝影来说仍旧会是充满挑战的一年。 在中阶上,商汤绝影在广汽传祺上量产交付了基于J6M的中阶方案。不过,今年中阶市场将迎来升级迭 代,也就是基于J6M做出来城区NOA,从目前的高速NOA升级为全域NOA,这是今年中阶市场最大的变 化。 一些头部公司基于高阶方案的蒸馏剪裁推出了轻量版的城区NOA,下放到100 TOPS算力左右的芯片上, 而且已经给主机厂客户做推广演示。 这次算法方案的升级迭代也会改变中阶市场的格局。跟得上的玩家,将会继续留在牌桌上,而跟不上 的,就有可能被挤下来。 这是行业非常残酷的一面,算法方案每年一次迭代 ...
如何看待目前VLA的具身智能技术?VLA还算是弱智人?
自动驾驶之心· 2025-06-27 17:15
作者 | 弗雷尔卓德 编辑 | 自动驾驶之心 原文链接: https://www.zhihu.com/question/1920708362489828723/answer/1920722548087292522 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 现在公司主流的都是VLA,包括DeepMind Gemini Robots, 还有一种公司都采用VLA技术,为什么呢?(因 为又懒又蠢) VLA本质上就是一个升级版BC,没有太多新的东西。 很多纯CS出身的人,常常陷入误区,效果不好是因为这个框架可以微调改进,效果从90%可以微调到 95%,哦耶,这样赢了。 问题是,本身90%这个,效果就是极其不科学的计算出来的准确率,成功率,你tm摆拍30次,成功了27 次,你给我说你这个任务成功率90%。 弗雷哥揭露这些人,怎么得出90%的这个效果的,实际上你成功率100%都可以,完全你自己去控制难度。 太多不看版本 ★ 任务太简单,只有抓和放 场景太单一,场景就1-2个物 ...
基于VLM的快慢双系统自动驾驶 - DriveVLM解析~
自动驾驶之心· 2025-06-27 17:15
基于此DriveVLM主要有以下几个创新点: 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 近一年来,大模型的发展突飞猛进,大模型应用于各个下游任务的工作也层出不穷,今天和为大家分享清华&理想将大模型应用在自动驾 驶领域的一次尝试与探索,也是去年理想快慢双系统(E2E+VLM)的核心算法,利用大模型强大的few-shot能力,期望解决实际驾驶场景 中的长尾问题,提升自动驾驶系统的认知和推理能力。 DriveVLM主要的出发点来自于目前业界自动驾驶遇到的实际困难,随着智能驾驶逐渐从 L2 往 L4 迭代,在实际场景中遇到了各种各样的 长尾问题。这些长尾问题随着数据驱动的方式会逐渐收敛一些,这也是目前业界主流的思路和方法,期待通过数据驱动的方式逐渐毕竟 L4;但是大家随着研究的深入发现,真实场景中的长尾问题是无穷无尽的,只是 case by case 的数据驱动几乎无法进化到真正的 L4 无人驾 驶。因此,工业界和学术界需要进一步思考自动驾驶的下一代方案。 而数据集构建可以说是这篇工作最核心的内容,主要聚集自动驾驶场景关心的五个维度,下面一一展开介绍: Ch ...
数据闭环的核心 - 静态元素自动标注方案分享(车道线及静态障碍物)
自动驾驶之心· 2025-06-26 21:33
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 4D标注之静态元素 自轻图方案成为业内共识以来,业内很多公司都在铺开人力推进轻图算法量产。从整个算法落地的流程上看,首先需要依赖一定的标注数据训练模型,推进云端模型 训练进而生产自动化轻图数据,进而在反哺车端模型更新,通过迭代的方式泛化车端模型。车端模型一般是时序6v输入的,只能感知局部区域,而云端模型需要做全 场景的静态元素标注。 首先我们先回答一个问题:传统2D图像静态元素标注有什么缺陷? 以往2D空间标注,需要每个时间戳下都需要再图像上进行标注,模型做语义分割+深度预测。这样非常耗时费力,需要大量的重复工作。实际上我们只需要重建出3D 静态场景,在重建3D场景中静态元素只需标注一次。 基于此,业内开始重视基于重建图或者说3D场景的静态元素标注。 现有的方法,会先将3D场景转换为BEV视图,这样不会损失路面上的静态元素信息,但是整个BEV视图非常大,不适合模型直接训练使用。因此实际中会根据自车位 姿滑动窗口截取局部地面重建图,再去训练云端的自动标注大模型,这是和车端模型最大的区别。总结来说,云端的pipe ...
清华大学最新综述!当下智能驾驶中多传感器融合如何发展?
自动驾驶之心· 2025-06-26 20:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 今天自动驾驶之心为大家分享 清华大学 最新的工作! 具身AI中多传感器融合感 知:背景、方法、挑战与前景! 如果您有相关工作需要分享,请在文末联系我 们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一 步咨询 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Shulan Ruan等 编辑 | 自动驾驶之心 出发点与动机 1)具身AI与多传感器融合感知的重要性 近年来,随着深度学习和大型语言模型(LLM)的快速发展,人工智能在各个领域取得了显著进展。具身 AI作为AI的重要方向,指的是以物理实体为载体,通过在动态环境中实时感知来实现自主决策和行动能力 的智能形式,在自动驾驶、机器人群体智能等领域有广泛应用场景,是突破AI发展瓶颈、实现通用人工智 能(AGI)的关键路径。 在具身AI系统构建中,传感器数据理解是连接物理世界与数字智能的核心环节。具身智能体需要融合视觉 相机、毫米波雷达、激光雷达(LiDAR)、红外相机和惯性测量单元(IMU)等多模态传感器数据 ...