Workflow
自动驾驶之心
icon
搜索文档
小导想让我手搓一台自驾小车,看到了这个就不想动手了......
自动驾驶之心· 2025-08-05 11:09
产品概述 - 黑武士001是自动驾驶之心团队推出的教研一体轻量级解决方案,支持感知、定位、融合、导航、规划等多个功能平台,采用阿克曼底盘 [1] - 产品面向科研&教学级自动驾驶全栈小车市场,原价36999元,现赠送3门课程(模型部署+点云3D检测+多传感器融合)[1] - 产品支持二次开发和改装,预留了众多安装位置和接口,可加装相机、毫米波雷达等传感器 [2] 目标用户群体 - 本科生学习进阶与比赛 [2] - 研究生科研与论文发表 [2] - 研究生求职与项目经验积累 [2] - 高校实验室教具 [2] - 培训公司/职业院校教具 [2] 硬件配置 - 主要传感器包括:Mid 360 3D激光雷达、镭神智能2D激光雷达、奥比中光深度相机(自带IMU)[10] - 主控芯片采用Nvidia Orin NX 16G,配备1080p显示器 [10] - 底盘系统为阿克曼底盘,结构系统采用钣金件,硬铝+发黑处理 [10] - 车体尺寸620 x 400 x 320mm(长宽高),自车重量30kg,最大运动速度2m/s [12] 软件功能 - 支持ROS、C++、python语言框架,提供开发环境 [14] - 功能包括:2D/3D目标检测与分割、SLAM建图(2D/3D激光、视觉、惯性等)、点云处理、车辆导航与避障等 [15] - 支持一键启动,提供完整的开发环境配置 [14][24] 应用场景测试 - 已测试室内、室外、地库等多种场景下的感知、定位、融合、导航规划等功能 [4] - 具体测试场景包括:户外公园行驶、室内地库2D/3D激光建图、上下坡测试、室外大场景3D建图、室外夜间行驶等 [6][7][8][9][10] 售后服务 - 提供1年售后支持(非人为损坏),邮费由用户承担 [37] - 保修期内因操作失误/修改代码等个人原因导致损坏的,提供免费维修服务 [37]
面向量产VLA方案!FastDriveVLA:即插即用剪枝模块,推理加速近4倍(北大&小鹏)
自动驾驶之心· 2025-08-05 07:33
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 今天自动驾驶之心为大家分享 北京大学,小鹏汽车 最新的工作! FastDriveVLA:对抗性视觉token剪枝,50%压缩率下性能保持 97.3%! 如果您有相关工作需要分享,请在文末联系我们! 自动驾驶课程学习与 技术交流群加入 ,也欢迎添加小助理微信AIDriver005 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文链接:https://www.arxiv.org/pdf/2507.23318 不过,VLM/VLA 模型通常将输入图像编码为大量视觉,会带来高昂的计算开销与推理延迟,在车载芯片上实际部署时有着较高的时延压力。为缓解这一问题,现 有研究主要从两个方向进行视觉 token 剪枝: 1. 注意力机制导向方法 依据文本 token 与视觉 token 之间的注意力权重进行筛选。但是因为驾驶任务中的文本指令往往固定且简短,提供的监督信息有限,导致剪枝效果不佳。 2. 相似度导向方法 论文作者 | Jiajun Cao等 编辑 | 自动驾驶之心 写在前面 && 笔者理解 近年来,端到端自动 ...
自动驾驶下半场 - 千万级自动标注量产泛化的困局。。。
自动驾驶之心· 2025-08-05 07:33
智能驾驶行业趋势 - 智能驾驶进入下半场,核心转向千万级4D自动标注的量产泛化能力,高阶智驾需求推动行业对数据质量和数量的要求显著提升[2] - 端到端、大模型、VLA等技术发展使传统人工标注效率无法满足量产需求,4D自动标注成为行业刚需[2] - 云端模型算法工程师薪资达百万级,反映技术人才供需失衡[2] 4D自动标注技术难点 - 时空一致性要求极高:需在连续帧中精准追踪动态目标运动轨迹,复杂场景下的遮挡、形变易导致标注断裂[4] - 多模态数据融合复杂:需同步激光雷达、相机、雷达等多源传感器数据,解决坐标对齐、语义统一和时延补偿问题[5] - 动态场景泛化难度大:交通参与者行为不确定性(如急刹、变道)及环境干扰(光照变化、恶劣天气)增加标注模型挑战[5] - 标注效率与成本矛盾:高精度4D标注依赖人工校验,海量数据导致周期长、成本高,自动化算法在复杂场景精度不足[5] 4D自动标注课程核心内容 - 动态障碍物标注:涵盖3D目标检测算法(如SAFDNet)、多目标跟踪(轨迹生命周期管理、ID跳变优化)、传感器遮挡优化等实战内容[9] - 激光&视觉SLAM重建:讲解重建算法基本模块、Graph-based激光SLAM算法及在4D标注中的应用[10] - 静态元素标注:基于SLAM重建图实现全局道路信息标注,避免单帧感知偏差[12] - 通用障碍物OCC标注:解析特斯拉Occupancy Network量产方案,涵盖Lidar/视觉真值生成流程及工程优化[13][14] - 端到端真值生成:整合动态障碍物、静态元素、可行驶区域、自车轨迹,结合DrivingGaussian算法实现闭环仿真[15] 行业痛点与解决方案 - 量产场景泛化是当前最大痛点:需解决不同城市、道路、天气条件下的数据挖掘与标注算法性能保障[5] - 数据闭环迭代效率受限于标注瓶颈,直接影响自动驾驶系统安全性与泛化能力[5] - 行业主流公司采用数据驱动架构,但跨传感器/跨感知系统协同仍存在技术挑战[17] 技术人才需求 - 课程面向高校研究人员、企业技术骨干及转行人员,要求具备深度学习、Transformer模型及PyTorch基础[21][25] - 课程目标包括掌握4D标注全流程、工业界前沿算法及实际工程问题解决能力,提升就业竞争力[22]
自动驾驶秋招&社招求职群成立了!
自动驾驶之心· 2025-08-05 07:33
自动驾驶技术趋势 - 自动驾驶技术栈呈现趋同态势,从过去分散的几十个方向逐渐向统一方案演进 [1] - 当前技术发展重点集中在one model、VLM(视觉语言模型)、VLA(视觉语言行动模型)等统一架构 [1] - 技术方案统一化背后反映出行业技术壁垒的显著提升 [1] 行业社群发展 - 行业社群定位为综合型平台,旨在汇集自动驾驶全产业链人才 [1] - 社群主要功能包括产业动态讨论、公司分析、产品研发交流、求职与职业发展等内容 [1] - 社群运营目标是通过资源共享帮助从业者成长,并建立行业人脉网络 [1]
浙大MambaMap:基于状态空间模型的在线矢量高精地图构建
自动驾驶之心· 2025-08-05 07:33
作者 | 自动驾驶专栏 来源 | 自动驾驶专栏 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 摘要 本文介绍了 MambaMap:基于状态空间模型的在线矢量高精地图构建。高精(HD)地图对于自动驾驶至关重要,因为它们为下游任务提供了精确的道 路信息。最新的进展突出了时间建模在应对遮挡和延伸的感知范围等挑战方面的潜力。然而,现有的方法要么无法充分利用时间信息,要么在处理扩展序列 方面产生巨大的计算开销。为了应对这些挑战,本文提出了MambaMap,这是一种新型的框架,它能够高效地融合状态空间中的长距离时间特征,以构建 在线矢量高精地图。具体而言,MambaMap结合了记忆库来存储并且利用历史帧信息,动态地更新BEV特征和实例查询以提高对噪声和遮挡的鲁棒性。此 外,本文还在状态空间中引入了门控机制,以计算高效的方式选择性地集成地图元素的依赖关系。创新性地,本文设计了多向扫描策略和时空扫描策略,分 别在BEV级和实例级增强特征提取能力。这些策略显著提高了所提出方法的预测准 ...
暑期打比赛!PRCV 2025空间智能与具身智能视觉感知挑战赛报名即将截止~
自动驾驶之心· 2025-08-04 15:31
竞赛概述 - 竞赛聚焦空间智能与具身智能视觉感知技术 旨在推动自动驾驶 智慧城市 机器人等场景的应用突破[4][5] - 核心目标包括推动高效高质量的空间智能技术研究 探索强化学习与计算机视觉等前沿方法创新 促进神经渲染与机器人抓取等应用落地[7] 组织架构 - 主办方包括北京科技大学 清华大学 中国科学院自动化研究所等顶尖机构 技术赞助由九章云极科技提供[9] - 指导专家团队由张兆翔 鲁继文 殷绪成等学界权威组成 确保竞赛专业度[9] 赛制设计 - 设置双赛道:空间智能赛道考核多视角航拍图像三维重建 具身智能赛道测试动态遮挡环境下的机器人抓取能力[20] - 评价体系差异化:空间智能侧重渲染质量(PSNR)与几何精度(F1-Score) 权重6:4 具身智能关注任务完成度(成功率)与执行效率(路径效率) 权重5:5[22][23] 资源支持 - 提供500-1000张1k分辨率无人机航拍图及仿真环境数据集 九章云极赞助8卡H800 GPU算力验证[14][15] - 算力优惠政策:新用户享6元/度体验价 H800 8卡月租4.2万元 显著降低参赛成本[16][17] 赛事日程 - 6月10日发布赛题 8月10日截止报名 9月30日完成评审 10月15日PRCV大会颁奖[13] - 允许2次结果更新 需提交技术报告说明方法细节 最终成绩前20名可获排名积分[26] 奖项设置 - 单赛道设一等奖(6000元+500度算力券) 二等奖(3000元+200度) 三等奖(1000元+100度) 优胜奖(500元+50度)[25][27] - 所有获奖团队将获得PRCV 2025组委会认证证书 奖金及算力券由九章云极全额赞助[27]
机器人不只会抓和放!北大x银河通用「世界-动作模型」来了
自动驾驶之心· 2025-08-04 15:31
点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 本文的作者团队来自北京大学和银河通用机器人公司。第一作者为北京大学计算机学院前沿计算研究中心博士生吕江燃,主要研究方向为具身智能,聚焦于世 界模型和机器人的灵巧操作,论文发表于 ICCV,TPAMI,RSS,CoRL,RAL 等机器人顶会顶刊。本文的通讯作者为北京大学计算机学院教授王亦洲和 北京 大学助理教授、银河通用创始人及CTO 王鹤。 尽管当前的机器人视觉语言操作模型(VLA)展现出一定的泛化能力,但其操作模式仍以准静态的抓取与放置(pick-and-place)为主。相比之下,人类在操作物 体时常常采用推动、翻转等更加灵活的方式。若机器人仅掌握抓取,将难以应对现实环境中的复杂任务。例如,抓起一张薄薄的银行卡,通常需要先将其推到桌 边;而抓取一个宽大的盒子,则往往需要先将其翻转立起(如图 1 所示): 这些技能都属于一个重要的领域:非抓握操作(Non-prehensile Manipulation) ...
CVPR 2025中稿新高的背后,录用率却仅22.1%。。。
自动驾驶之心· 2025-08-04 11:23
AI顶会投稿现状与痛点 - 2025年AI顶会投稿量爆炸式增长 CVPR投稿量达1 3万篇但录用率仅22 1% 反映学术竞争白热化 [1] - 审稿质量出现显著滑坡 NeurIPS出现将Adam优化器误认为"陌生人名"的离谱审稿意见 该算法被引量超22万次 [1] - 19篇CVPR论文因审稿人滥用AI生成意见遭"连坐拒稿" 暴露审稿机制漏洞 [1] 论文被拒核心原因 - 60%的Desk Reject源于期刊方向匹配错误 显示学者对期刊定位理解不足 [3] - 65%拒稿因方法学漏洞和实验不可复现 反映科研严谨性缺失 [1][3] - 78%论文因写作问题被拒 包括逻辑混乱和"不会讲故事"等表达缺陷 [1][3] - 23%初审淘汰源于格式错误等流程性失误 凸显投稿规范意识薄弱 [2] 学术辅导服务优势 - 公司拥有300+专职导师团队 均来自QS前100高校 发表过顶会/子刊论文 覆盖自动驾驶等前沿领域 [4] - 近3年辅导400+学员 中稿率高达96% 提供从选题到投稿的全流程服务 [4][11] - 采用精准匹配系统 根据研究方向/目标期刊筛选3-5位导师 支持不满意更换 [18] - 优秀学员可获清北/MIT推荐信 并内推至阿里达摩院等企业研发岗 [19] 服务内容与形式 - 提供科研思维训练 经典算法体系构建 代码实践结合等系统化培养 [9][12] - 课程形式包括1v1在线教学 微信群答疑 录播回看等 配备班主任全程督学 [15][17] - 零基础学员可通过6个月系统训练产出小论文 包含文献带读等基础课程 [18]
厘米级精度重建!最强性价比3D激光扫描仪~
自动驾驶之心· 2025-08-04 11:23
最强性价比3D激光扫描仪 使用门槛低 :操作简单直观,一键启动即可 执行扫描作业 扫描结果导出即用 :无需复杂部署和繁琐处理,扫 描结果导出即用 高效率高精度建图 :模型精度高,行走之间轻松扫 描大场景 业内最优惠价格 :性价比高,高度 集成多传感器, 往下翻~ 重磅!3DGS版本来啦 3DGS渲染版本来啦,支持离线渲染和在线渲染两种,直接看一下效果吧!!!! | 雄厚背景&项目验证 | | --- | 面向工业场景和教研场景的 超高性价比3D扫描仪来了!GeoScan S1是国内目前最强性价比实景三维激光扫描 仪,轻量化设计,一键启动,便可拥有高效实用的三维解决方案。以多模态传感器融合算法为核心,实现厘米级 精度的三维场景实时重构。可广泛用于多种作业领域。 每秒20万级点云成图,70米测量距离,360°全域覆盖,支持20万平米以上的大场景,扫描可选配3D高斯数据采 集模块,实现高保真实景还原。支持跨平台集成,配备高带宽网口及双USB 3.0接口,为科研实验提供灵活扩展 空间。降低开发门槛,助力开发者快速掌握研发能力,开启更多可能。 GeoScan S1设备自带手持Ubuntu系统和多种传感器设备,手柄集成了 ...
秋招面经!大疆卓驭感知算法工程师面试~
自动驾驶之心· 2025-08-04 07:32
自动驾驶行业求职分析 - 自动驾驶算法岗位需求集中在动态目标感知、多传感器融合、BEV感知等方向,核心技能包括深度学习、计算机视觉、优化算法等 [5][7][10] - 岗位职责涉及车道线识别、障碍物追踪、轨迹预测、4D场景重建等实际应用场景,技术落地性强 [10] - 头部企业如小米汽车、理想汽车、华为等均在招聘相关算法人才,行业处于快速发展期 [28] 岗位技术要求 - 硬性条件包括计算机/自动化硕士学历、C++/Python编程能力、多视图几何/深度学习/滤波算法等专业知识 [7] - 加分项涵盖传感器融合经验、顶级会议论文发表、ACM/机器人竞赛经历等 [9] - 工程能力要求突出,需熟悉模型部署工具(TensorRT/ncnn)、量化原理、知识蒸馏等产业化技术 [3][16] 面试流程与内容 - 技术面试深度考察项目细节,如SLAM系统设计、噪声分析、精度评估方法等 [2][3] - 算法原理类问题涉及Transformer有效性、多头注意力机制、Occupancy Network等前沿技术 [2] - 编程基础测试包括C++智能指针、动态库链接、CMake管理等系统级知识 [2] 行业资源与培训 - AutoRobo知识星球提供面试题库(BEV感知、多传感器标定等12个专项百问)、行业研报(人形机器人蓝皮书等)、面经复盘等实用资源 [16][23][24] - 社区覆盖近1000名从业者,包含智元机器人、地平线等企业员工及应届求职者,形成行业生态网络 [13] - 付费星球服务(20元优惠券)整合内推渠道、谈薪技巧、简历优化等求职全流程支持 [32][33] 职业发展建议 - 需明确技术路线选择(如SLAM转动态感知的适应性),平衡学术研究与工程落地需求 [2][3] - 行业研报建议关注具身智能、4D重建等新兴方向,把握技术演进趋势 [21][23] - 面试复盘显示头部企业重视解决方案设计能力(如前/后融合策略)及跨领域知识迁移能力 [2][24]