自动驾驶之心

搜索文档
秋招面经!大疆卓驭感知算法工程师面试~
自动驾驶之心· 2025-08-04 07:32
自动驾驶行业求职分析 - 自动驾驶算法岗位需求集中在动态目标感知、多传感器融合、BEV感知等方向,核心技能包括深度学习、计算机视觉、优化算法等 [5][7][10] - 岗位职责涉及车道线识别、障碍物追踪、轨迹预测、4D场景重建等实际应用场景,技术落地性强 [10] - 头部企业如小米汽车、理想汽车、华为等均在招聘相关算法人才,行业处于快速发展期 [28] 岗位技术要求 - 硬性条件包括计算机/自动化硕士学历、C++/Python编程能力、多视图几何/深度学习/滤波算法等专业知识 [7] - 加分项涵盖传感器融合经验、顶级会议论文发表、ACM/机器人竞赛经历等 [9] - 工程能力要求突出,需熟悉模型部署工具(TensorRT/ncnn)、量化原理、知识蒸馏等产业化技术 [3][16] 面试流程与内容 - 技术面试深度考察项目细节,如SLAM系统设计、噪声分析、精度评估方法等 [2][3] - 算法原理类问题涉及Transformer有效性、多头注意力机制、Occupancy Network等前沿技术 [2] - 编程基础测试包括C++智能指针、动态库链接、CMake管理等系统级知识 [2] 行业资源与培训 - AutoRobo知识星球提供面试题库(BEV感知、多传感器标定等12个专项百问)、行业研报(人形机器人蓝皮书等)、面经复盘等实用资源 [16][23][24] - 社区覆盖近1000名从业者,包含智元机器人、地平线等企业员工及应届求职者,形成行业生态网络 [13] - 付费星球服务(20元优惠券)整合内推渠道、谈薪技巧、简历优化等求职全流程支持 [32][33] 职业发展建议 - 需明确技术路线选择(如SLAM转动态感知的适应性),平衡学术研究与工程落地需求 [2][3] - 行业研报建议关注具身智能、4D重建等新兴方向,把握技术演进趋势 [21][23] - 面试复盘显示头部企业重视解决方案设计能力(如前/后融合策略)及跨领域知识迁移能力 [2][24]
自动驾驶之心VLA技术交流群成立了(数据/模型/部署等方向)
自动驾驶之心· 2025-08-04 07:32
自动驾驶技术交流群成立 - 自动驾驶之心大模型VLA技术交流群正式成立,旨在促进VLA相关技术的交流与合作 [1] - 交流内容涵盖VLA数据集制作、一段式VLA、分层VLA、基于大模型的端到端方案、基于VLM+DP的方案、量产落地及求职等方向 [1] - 感兴趣者可添加小助理微信AIDriver005并备注昵称+VLA加群以加入交流 [1]
自动驾驶运动规划(motion planning)发展到了什么阶段?
自动驾驶之心· 2025-08-03 08:33
交互式规划技术框架 - 交互式规划本质上是一个世界模型 用于描述自车与周围环境的动态交互关系[4] - 交互建模的核心在于推理其他交通参与者的未来行为 涉及博弈论、POMDP和应变规划器等理论框架[5] - 典型方法包括基于预测模型的交互规划 通过扰动自车轨迹增强条件预测(EC) 并构建轨迹树进行动态规划优化[6] TPP(Tree-structured Policy Planning)方法 - 通过构建自车轨迹树 为每个分支生成预测场景树 最后通过动态规划获得最优策略[6] - 损失函数包含三个部分:预测损失L_prediction(预测结果与GT的误差)、EC碰撞损失L_EC_collision(预测结果与自车轨迹的碰撞)、碰撞损失L_collision(交通参与者之间的碰撞)[9] - 其中L_EC_collision强制要求预测的交通参与者不能与自车轨迹发生碰撞 体现了交互逻辑[9] IJP(Interactive Joint Planning)方法 - 采用基于同伦(homotopy)的轨迹采样方法 将障碍物视为电流 利用安培环路定律计算磁场线积分 大幅减少采样数量[13][15] - 通过模型预测控制(MPC)联合优化自车和其他交通参与者轨迹 线性约束条件考虑了自车与其他车辆之间的碰撞关系[16] - 计算延迟分析显示:预测部分耗时50ms(Nvidia 3090) SQP求解每条轨迹需300ms(构建150ms+求解150ms) 总延迟达1850ms[18] 实时性优化方案 - 采用ADMM(交替方向乘子法)替代SQP 将大规模优化问题分解为可组合的子问题 在16个交通参与者情况下可达125Hz频率[19] - 嵌入式在线MPC技术可实现兆赫兹级别的优化速率 满足实时性要求[19] DIPP(Differentiable Integrated Prediction and Planning)方法 - 采用可微分框架 联合学习预测模型和规划代价函数的权重参数[21][22] - 损失函数包含多模态预测损失L_prediction、评分损失L_score、模仿损失L_imitation和代价损失L_cost[31] - 使用Transformer编码器处理交通参与者历史和地图信息 通过可微非线性运动规划器进行优化[27][30] 技术挑战与局限性 - 预测导向方法存在反事实安全问题 如主动汇入场景中预测与实际行为可能不一致[41] - 静态场景(如道路施工)中预测导向方法效果有限 需要参数自动调整而非轨迹学习[44] - 真实标注数据存在不一致性问题 驾驶员行为有时让行有时主动 需要行为/轨迹聚类[41] 方法对比与应用前景 - TPP采用采样生成自车轨迹 预测模型参数可学习 代价权重人工设定[40] - IJP通过优化生成自车轨迹 预测模型参数固定 代价权重人工设定[40] - DIPP通过Transformer和优化器生成自车轨迹 预测模型参数和代价权重均可学习[40] - 模块化框架(IJP)性能明确但依赖预测模型质量 端到端框架(DIPP)性能不明确但值得探索[45] - 未来方向包括:Theseus库参数调优、联合优化解释性、Transformer交互建模可扩展性[45]
准备扩大自驾团队了,欢迎家入我们~
自动驾驶之心· 2025-08-03 08:33
行业发展趋势 - 智能驾驶行业正从L2向L3阶段过渡 技术突破推动实际体验持续改善 [2] - 小米汽车YU7车型三分钟大定突破20万台 反映产品硬实力与品牌软实力协同效应 [2] - 行业进入下沉期 需攻克复杂技术难题 强调稳扎稳打突破量产瓶颈 [2] 公司业务动态 - 自动驾驶之心平台聚焦智能驾驶项目合作与教育研发 运营已进入第四年 [2] - 推出自驾教育在线课程、企业咨询及辅导业务 覆盖大模型/多模态等前沿技术方向 [3] - 提供行业资源共享机制 支持兼职或全职合作模式 分红比例较高 [6] 人才需求 - 招募博士及以上学历人才 工业界要求3年以上研发经验 [4] - 重点需求方向包括大模型部署、强化学习、端到端系统等15个技术领域 [3][8]
自动驾驶数据标注主要是标注什么?
自动驾驶之心· 2025-08-03 08:33
自动驾驶数据标注的核心作用 - 数据标注是将原始感知数据转化为结构化标签的基础环节,直接影响自动驾驶系统的识别、理解和决策能力 [4] - 准确系统的标注能提升感知算法的鲁棒性与泛化能力,在技术体系中具有不可替代性 [4] 图像数据标注方法 - 标注目标包括车辆、非机动车、行人、交通标志、红绿灯、车道线等关键对象 [5] - 采用二维边界框、实例分割或语义分割形式,语义分割对每个像素赋予类别标签实现高精度识别 [5] - 实例分割区分同类物体个体边界,如并行车辆需标注为"车辆A"、"车辆B"等独立实体 [5] 激光雷达点云标注特点 - 通过三维包围框记录目标在X/Y/Z轴的尺寸、中心点、朝向角和类别属性 [7] - 需标注动态状态(静止、缓行、变道)并在连续帧中赋予一致标识符(object ID)以构建时序轨迹 [7] 多传感器融合标注要求 - 图像与激光雷达数据需跨模态标注对应关系,通过坐标转换实现二维与三维语义对齐 [9] - 依赖高精度传感器外参标定,为多模态特征提取和时空建模提供基础支撑 [9] 高精地图标注内容 - 提取车道中心线、边界、类型、交通标志、信号灯结构、道路坡度等静态元素 [9] - 以图层形式叠加在WGS-84坐标系,要求厘米级精度并与感知标注保持语义一致性 [9] 环境与行为标注扩展 - 环境标签包括道路类型、天气条件、光照、交通密度等非结构化信息 [11] - 行为标注记录运动轨迹及加速、转向、横穿等动态属性,用于训练轨迹预测和意图识别模型 [11] - 人类目标可能标注关键点(头部、关节)或动作标签(挥手、奔跑)以支持复杂交互推理 [11] 标注质量控制与行业实践 - 通过标准化规范、人工复审和自动化脚本检测确保语义、空间、时间维度一致性 [13] - 特斯拉通过"影子模式"采集误判样本再标注,Waymo发布开放数据集推动行业标准趋同 [13] - 百度Apollo等国内企业通过本地化数据采集与标注提升场景适应性 [13] 数据标注的系统性价值 - 标注工作为算法提供涵盖二维语义、三维建模、多模态融合、高精地图及行为轨迹的全样本 [14] - 标准化与质量保障是实现感知、预测、决策、控制四大模块协同运作的基础支撑 [14]
4000人了,我们搭建了一个非常全栈的自动驾驶社区!
自动驾驶之心· 2025-08-03 08:33
自动驾驶行业现状与趋势 - 自动驾驶技术栈趋同 端到端+大模型成为主流方向 行业从百花齐放进入收敛阶段 [2] - 国内智测量产存在浮躁现象 方案未完全收敛即急于上车 行业需沉淀解决实际问题 [3] - 具身智能领域吸引部分从业者转行 但自动驾驶仍被视为最接近实现的通用具身智能赛道 [3] 技术发展方向 - 未来量产模型将呈现统一、多模态、端到端特征 模块化方法逐渐被淘汰 [3] - 行业对全栈人才需求迫切 需同时掌握感知、规划、预测、大模型及部署优化等技能 [3] - VLA(视觉语言模型)成为2025年热点技术方向 涉及开源数据集、模块化设计及量产方案等研究 [42] 学术与产业资源 - 自动驾驶之心社区整合40+技术路线 覆盖BEV感知、3DGS、世界模型等前沿方向 [5][16] - 汇集60+自动驾驶数据集 包括多模态大模型预训练/微调专用数据集 [32] - 链接国内外顶尖高校实验室(清华、CMU、ETH等)及头部企业(蔚小理、华为、大疆等) [16] 职业发展观察 - 行业薪资仍具竞争力 但面临转型压力 部分从业者权衡高薪与稳定性 [83] - 主机厂与供应商岗位选择成焦点 华为车BU、Momenta等企业技术认可度高 [83] - 应届生职业规划关注技术成长与企业前景 滴滴KargoBot等新兴领域受青睐 [83] 社区生态建设 - 提供学术前沿内容、工业界圆桌会议、开源代码及求职信息 形成产学研闭环 [5][21] - 定期举办超100场专业直播 邀请清华、上海AI Lab等机构专家分享最新成果 [79] - 建立40+开源项目库 涵盖BEV感知、Occupancy Network等关键技术 [30]
自动驾驶之心VLA技术交流群成立了~(数据/模型/部署等方向)
自动驾驶之心· 2025-08-02 19:49
自动驾驶技术交流群成立 - 自动驾驶之心VLA技术交流群正式成立,旨在促进VLA相关技术的交流与合作 [1] - 交流内容涵盖VLA数据集制作、一段式VLA、分层VLA、基于大模型的端到端方案、基于VLM+DP的方案、量产落地以及求职等多个领域 [1] - 感兴趣者可添加小助理微信AIDriver005,备注昵称+VLA加群以加入交流 [1]
开课倒计时!国内首个自动驾驶端到端项目级教程来啦~
自动驾驶之心· 2025-08-02 14:00
端到端自动驾驶行业现状 - 端到端自动驾驶已成为国内主流新能源主机厂技术竞争的核心领域 自去年E2E+VLM双系统架构成功以来 行业加速迭代 今年上半年VLA概念进一步推动量产方案升级 [2] - 行业人才需求旺盛 3-5年经验的VLM/VLA岗位年薪达百万 月薪高达80K 校招/社招转岗需求激增 [2] - 技术流派分化明显 包括以PLUTO为代表的二段式端到端 以UniAD为代表的一段式端到端 以及基于世界模型/扩散模型/VLA的新兴流派 [4] 技术流派分类与特点 - **二段式端到端**:通过模型实现自车规划 代表工作包括港科技PLUTO 浙大CarPlanner(CVPR'25) 中科院Plan-R1 相比一段式具有明确规划模块优势 [4][20] - **一段式端到端**: - 基于感知的方法:UniAD持续迭代 地平线VAD和CVPR'24的PARA-Drive推动性能提升 [21] - 基于世界模型的方法:AAAI'25的Drive-OccWorld和复旦OccLLaMA拓展场景生成与闭环仿真应用 [21] - 基于扩散模型的方法:DiffusionDrive/Diffusion Planner/吉大DiffE2E实现多模轨迹预测 适应环境不确定性 [21] - 基于VLA的方法:小米ORION 慕尼黑工大OpenDriveVLA 最新ReCogDrive代表大模型时代技术前沿 [21] 核心技术栈与学习路径 - 必备技术包括大语言模型 BEV感知 扩散模型理论 强化学习与RLHF DEEPSEEK优化技术等 构成未来两年求职高频考点 [6][22] - 学习难点在于多领域知识融合(多模态大模型/BEV/强化学习/视觉Transformer/扩散模型) 论文碎片化 缺乏实战闭环指导 [12][13] - 行业推出《端到端与VLA自动驾驶小班课》 采用Just-in-Time Learning理念 覆盖技术框架构建(第二章) 二段式(第三章) 一段式与VLA(第四章) 及RLHF微调实战(第五章) [14][15][16][21][23] 职业发展前景 - VLA/VLM大模型算法专家岗位3-5年经验硕士薪资达40-70K·15薪 博士应届生可达90-120K·16薪 实习生日薪220-400元 [11] - 职业路径包括算法岗技能深化 或转型自动驾驶大模型工程师 需掌握VLM/VLA多模态 模型量化部署等核心技术 [9][10] - 课程目标使学员达到1年经验算法工程师水平 可复现扩散模型/VLA框架 应用于实习/校招/社招场景 [28] 课程体系设计 - 第一章梳理端到端发展历史 对比模块化/一段式/二段式/VLA范式优缺点 分析学术与工业界动态 [19] - 第二章重点突破背景知识 包括Transformer扩展至视觉Transformer CLIP/LLAVA多模态基础 BEV感知实现3D检测/车道线/OCC等核心功能 [22] - 实战环节配置Diffusion Planner和小米ORION开源项目 结合RLHF微调大作业强化工程能力 [21][23] - 课程周期3个月 8月15日开课 分阶段解锁章节 需自备4090及以上GPU算力 要求具备Transformer/BEV/强化学习基础概念 [28]
自动驾驶之心求职与行业交流群来啦~
自动驾驶之心· 2025-08-02 14:00
行业与求职现状 - 学校学习内容与实际工作需求存在显著差距 导致应届生在求职时缺乏竞争优势 [1] - 从业者存在转型需求 如转向大模型 世界模型或具身智能领域 但对行业实际动态了解不足 [1] 社群定位与功能 - 社群目标为搭建连接学校与企业的综合型平台 促进人才与产业对接 [1] - 核心讨论内容包括产业趋势 公司动态 产品研发及求职跳槽信息 [1] - 提供行业人脉拓展渠道 帮助成员获取第一手产业资讯 [1] 社群运营方式 - 通过微信扫码添加助理并备注"自驾+昵称+求职"完成入群申请 [1]
打算在招募一些自动驾驶大佬,共创平台!
自动驾驶之心· 2025-08-02 00:03
行业发展趋势 - 智能驾驶正从L2向L3阶段过渡 技术突破带来实际体验提升 行业逐渐普及化[2] - 小米汽车YU7三分钟大定突破20万台 反映产品硬实力与集团软实力的市场认可度[2] - 行业进入下沉期 需攻克复杂技术难题 强调稳扎稳打突破量产瓶颈[2] 公司业务动态 - 自动驾驶之心平台成立四年 聚焦智能驾驶项目合作与教育研发 汇聚全球开发者资源[2] - 开展自驾教育在线课程 企业咨询及辅导业务 覆盖大模型 端到端技术等15个前沿方向[3] - 提供行业资源共享与分红机制 支持兼职或全职合作模式[6] 人才需求 - 招募博士及以上学历人才 工业界需具备3年以上研发经验[4] - 重点引进大模型部署 强化学习 3D仿真等领域的专家[3]