Workflow
端到端算法
icon
搜索文档
开学了,需要一个报团取暖的自驾学习社区...
自动驾驶之心· 2025-09-05 07:33
发offer的是业内一家tier 1公司,测试的岗位。受限于研究生期间做的工作,转感知算法还有一些困难,剩下两个月的时间,还是打算冲一把到算法岗,平时跟着 自动驾驶之心一直学习前沿的算法,觉得自己还是有机会的。 很开心,这位同学没有放弃自己,有时候不逼自己一把是不知道自己的极限在哪里! 值此开学季之际,我们也为大家准备了重磅学习礼包: 对于秋招的小伙伴来说应该比较关键,金九银十正式开启了。这两天有个同学联系柱哥说已经拿到了一个offer,但却开心不起来。 1. 重磅推出299元超级折扣卡(一年期有效):购买后,享受全平台课程七折优惠; 2. 自动驾驶之心知识星球立减88; 3. 课程福利放送:满1000元赠送2门带读课程(八选二); 4. 自动驾驶论文辅导1000最高抵扣10000; 5. 自动驾驶1v6小班课限时福利立减1000; 6. 全平台硬件优惠: 全栈教研平台黑武士001 足式/强化学习科研平台:TRON1 四足机械狗+机械臂科研平台 桌面级机械臂科研平台 数采夹爪(单臂+双臂方案) 超级折扣卡 重点介绍下我们最新推出的超级折扣卡!活动期间购买有效, 自购买之日起一年时间内,购买平台任意课程均享受七 ...
小鹏加码主动安全:CEO 下场动员,想用技术成果回应外界质疑
晚点Auto· 2025-08-31 19:59
核心观点 - 主动安全已成为智能电动车技术竞赛的新焦点 公司通过重写主动安全架构和代码 实现每日迭代更新 以重新进入主动安全第一梯队[2] - 公司采用纯视觉方案 通过端到端+NGP架构提升主动安全性能 实现130公里/时全速域AEB和行业唯一的低附着路面AES功能[4][7][19] - 团队通过设立急战室和每日迭代的开发模式 在半年内完成主动安全系统升级 以应对市场竞争和用户对安全功能的需求[15][16][13] 技术突破 - AEB系统覆盖0-150公里/时全速域 针对静止障碍物在130公里/时高速下实现两段式刹停 先以0.6-0.7G减速度提醒 再以1G减速度紧急制动[4] - 冰雪AES功能通过单边制动技术 在80-130公里时速范围内实现紧急转向避让 解决低附着系数路面(低于0.3)的车辆控制问题[7][8] - 视觉摄像头采用24Hz帧率 响应速度达主流激光雷达的2倍 端到端模型延时降低一半[19] 开发过程 - 组建跨部门团队(智驾+底盘)进行技术融合 通过实车测试验证单边制动等创新方案[9][10] - 在广州和上海设立急战室 实行每日版本迭代和每周例会机制 确保开发进度和质量控制[15][16] - 使用累计的庞大数据库(含标签数据)进行模型训练 道路测试超60万公里 并辅以云端仿真测试[20] 行业背景 - 行业从基础AEB功能转向高速/夜间/极端天气等复杂场景的性能竞争 AEB成为衡量智能辅助驾驶能力的新标尺[3] - 端到端算法应用趋于成熟 可提升场景识别准确率和驾驶行为拟人化 公司采用该架构重写AEB代码[18][19] - 纯视觉与多传感器融合路线存在争议 但公司通过纯视觉方案实现主动安全性能提升[12][19] 战略意义 - 主动安全被列为公司"五大战役"之一 获得高层直接关注和资源倾斜 包括算力分配和人员调配[13][17] - 技术显性化需求增强 需通过突破性功能(如冰雪AES)强化智能驾驶标签 应对行业竞争压力[14] - 优先解决高频高严重度场景(如车辆/行人/施工障碍) 终极目标为实现零碰撞的全场景覆盖[21][22]
从零开始!自动驾驶端到端与VLA学习路线图~
自动驾驶之心· 2025-08-25 07:32
端到端与VLA自动驾驶技术发展 - 端到端自动驾驶技术涉及多模态大模型、BEV感知、强化学习、视觉Transformer、扩散模型等多个领域技术栈 [32] - 技术发展从模块化方法演进至端到端范式 包括一段式、二段式和VLA范式 [36] - VLA(视觉语言动作)成为当前端到端自动驾驶的皇冠技术 上限高且业内招聘需求旺盛 [46] Transformer与大语言模型基础 - Transformer架构核心是注意力机制和多头注意力 通过基础模块堆叠形成Encoder和Decoder [11][13] - Token化采用BPE、Word-Piece等方法 通过合并高频字符实现压缩 [9][13] - 位置编码使用正弦和余弦函数 使模型记住词序且位置偏移量与当前位置呈线性关系 [9][13] 视觉与语言模型对齐技术 - CLIP是视觉与大模型对齐的广为认知的技术 为多模态大模型奠定基础 [18] - 视觉Transformer扩展了Transformer的基本概念 成为多模态模型重要组成部分 [43] - LLAVA等模型进一步推进了视觉语言模型的发展 [43] 课程内容体系设计 - 第一章介绍端到端算法发展历史、范式优缺点及学术界工业界动态 [36] - 第二章重点讲解大语言模型、BEV感知、扩散模型、强化学习等背景知识 [37][43] - 第三章分析二段式端到端 涵盖经典算法PLUTO、CVPR'25的CarPlanner和最新Plan-R1 [38] - 第四章深入一段式端到端子领域:基于感知的UniAD、基于世界模型的Drive-OccWorld、基于扩散模型的DiffusionDrive及基于VLA的ORION [39][41][44][46] - 第五章设置RLHF微调大作业 实现从理论到实践的完整闭环 [48] 技术人才市场需求 - VLA/VLM大模型算法专家岗位薪资达40-70K-15薪 要求3-5年经验硕士学历 [29] - VLA/VLM/LLM算法工程师薪资40-70K-15薪 不限经验但要求深度学习机器学习背景 [29] - VIA模型量化部署工程师薪资40-60K-15薪 要求1-3年经验及模型加速技能 [29] 课程特色与优势 - 采用Just-in-Time Learning理念 通过通俗语言和案例快速掌握核心技术栈 [33] - 帮助学员梳理研究发展脉络 形成自己的研究体系和工作经验 [34] - 配备实战环节包括Diffusion Planner和ORION开源推理评测模块 [44][46] - 学员结课后可达1年左右端到端自动驾驶算法工程师水平 [53] 讲师资质与课程安排 - 讲师Jason为C9本科+QS50 PHD 发表CCF-A论文2篇 现任TOP主机厂算法专家 [24][49] - 课程8月15日开课 预计三个月结课 采用离线视频教学+vip群答疑模式 [52] - 章节解锁时间安排:第一章8月01日、第二章8月15日、第三章8月30日、第四章9月15日、第五章10月30日 [53]
新势力销冠,实现盈利的零跑汽车:连续五个月霸榜,市值已翻倍
智通财经· 2025-08-20 16:35
财务业绩 - 2025年上半年收入242.5亿元,同比增长174% [1] - 毛利率达14.1%,创半年度历史新高,较2024年同期1.1%提升13个百分点 [1][6] - 股东净利润0.3亿元,经调整后股东净利润3.3亿元,成为第二家实现半年度盈利的中国造车新势力企业 [1][6] - 经营活动现金净额28.6亿元,在手资金达295.8亿元 [6] - 第二季度净利润1.63亿元,超出美银证券预期,较招银国际预期高出1.15亿元 [1] 销量表现 - 2025年上半年总交付量约22.2万辆,同比增长155.7%,位居中国新势力品牌交付量榜首 [1] - 2025年7月交付量达50129辆,连续5个月位居中国新势力品牌销量榜首,是2025年以来唯一月交付超5万辆的新势力品牌 [4] - 截至2025年8月,C10连续3个月稳居新势力中型SUV销量榜首,C16连续8周稳居20万内中大型SUV销量第一 [4] - 2025年1-7月出口量达24980辆,位居新势力出口榜首,7月欧洲单月订单超4000台创历史新高 [9][14] 产品战略 - 采取高端化策略,上半年单车价格同比上升76%,行业罕见 [5] - B系列4月上市车型B10次月交付破万,7月上市车型B01上市72小时订单超1万台 [4] - C系列长期霸榜销量榜单,B系列和C系列驱动销量持续突破 [4] - 全域自研技术LEAP3.5架构实现舱驾一体,12万级SUV B10搭载端到端辅助驾驶、激光雷达和高通8650芯片,续航达650公里 [7][8] 市场地位与投资者信心 - 取代理想成为新势力"零理小"格局领导者 [5] - 市值一度突破千亿港元,业绩发布次日股价涨幅7.63% [1] - 2025年市值升幅高达125%,港股通持股比例从4.8%提升至6.74% [14] - 美银证券、小摩及中金等多家投行上调目标价,平均目标价超90港元,较现价高出22.7% [14] 全球化布局 - 在欧洲、中东、非洲和亚太等约30国建立超600家销售服务网点,其中欧洲超550家 [14] - 计划2026年底前建立欧洲本土化生产基地 [14]
继理想后,第二家半年度盈利的新势力诞生
第一财经· 2025-08-19 09:29
财务表现 - 2025年上半年实现净利润人民币0.3亿元 经调整净利润人民币3.3亿元 成为中国造车新势力中第二家半年度盈利企业[1] - 上半年营业收入达242.5亿元 同比增长174% 毛利率为14.1% 但二季度实际毛利率不足14%[1] - 下半年毛利率目标维持14%-15% 全年整车毛利率预计约12% 年度净利润指引上调至5-10亿元[2] 销量与交付 - 上半年交付新车22.17万辆 同比增长155.7% 居中国新势力品牌销冠[1] - 全年销量目标上调至58-65万辆 原目标50-60万辆 2026年计划挑战100万辆销售目标[2] - 前七月累计销量27.18万辆 未来5个月需完成30万辆销售 月均目标6万辆[2] 资金与产能 - 截至上半年在手资金达295.8亿元[1] - 计划2026年底前建立欧洲本土化生产基地 优化全球成本结构[2] 技术研发 - 基于端到端算法的城市通勤领航辅助功能实现量产上车[1] - 下半年加大端到端和VLA技术研发 年底前实现城市NOA组合辅助驾驶能力[1] 战略合作 - 与中国一汽签署战略合作备忘录 开展新能源乘用车联合开发及零部件合作[2] - 首个合作开发车型项目已落地 双方正探讨深化资本合作可行性[2] 海外拓展 - 前七月出口量达24980辆 欧洲市场表现突出[2] - 海外市场成为第二增长曲线 全球市场布局持续推进[2]
传统规划控制不太好找工作了。。。
自动驾驶之心· 2025-07-11 14:46
行业趋势分析 - 自动驾驶规划控制岗位从传统逻辑兜底转向规则算法与端到端结合的技术路线[2] - 端到端和VLA(Vision-Language-Action)量产趋势正在挤压传统规划控制生存空间[2] - 2025年端到端技术进一步落地但传统规控在L4高安全性场景仍占主导地位[4] 岗位能力要求 - 基础能力需覆盖横纵联合/解耦框架、搜索/采样/运动学规划算法[4] - 差异化竞争力体现在不确定环境下的Contingency Planning和博弈式交互规划能力[4] - 端到端技术(一段式/二段式)、VLM/VLA与大模型结合成为必备技能[4][29] 课程核心价值 - 覆盖经典规控方案与端到端融合落地方案,包含2个可直接写入简历的工程项目[7][13] - 通过博弈交互式规划和防御式规划等头部公司重点研究方向提升竞争力[24][26] - 学完对标2-3年算法工程师经验,前两期学员入职华为/百度/蔚小理等企业[8][10] 课程体系设计 - 基础算法模块:搜索/采样/优化/深度学习等规划算法对比与应用场景选择[20] - 决策规划框架:路径-速度解耦、时空联合及数据驱动框架构建[21][22] - 端到端专项:分析VLM/VLA技术优势与局限性,探讨数据驱动收益最大化[29] - 面试闭环服务:简历修改+模拟面试+公司推荐,直击华为等大厂招聘标准[31][36] 技术落地方向 - 防御式规划(Contingency Planning)解决感知/定位/社会车意图不确定性[24] - 博弈论模型实现自车与他车轨迹联合优化,突破传统预测-规划链路局限[26] - 端到端系统与传统规控融合方案成为量产落地关键突破点[4][29] 教学资源配置 - 采用C++/Python双语言开发,代码开源并提供容器运行环境[15][17] - 直播+录播形式授课,配备VIP群答疑及3个月内持续服务[12][17] - 赠送《规划控制理论&实战课程》并配套500元简历修改服务[36]
传统规控和端到端岗位的博弈......(附招聘)
自动驾驶之心· 2025-07-10 11:03
行业技术趋势 - 端到端自动驾驶技术正快速冲击传统规控方法 其场景泛化能力和数据驱动特性显著优于基于规则的系统 [2] - 传统规控依赖人工编写规则(PID/LQR/MPC等算法) 优势在于可解释性强但难以覆盖所有场景 [2] - 端到端方案直接从传感器映射控制指令 减少模块化架构的信息损失 实现全局优化 [4] 技术方案对比 端到端方案 - 优势:降低系统复杂性 通过数据学习人类驾驶风格 支持全流程联合优化 [4] - 劣势:决策过程黑箱化 需海量训练数据 极端场景依赖规则兜底 [4] 传统PNC方案 - 优势:模块功能明确 已知场景稳定性高 适合高安全需求场景 [5] - 劣势:多模块协同开发成本高 复杂场景规则覆盖有限 依赖高精地图 [5] 技术融合方向 - 行业实践表明端到端与PNC呈互补关系 如华为ADAS3.0采用传统规控作为安全冗余 [6] - 传统规控工程师转型需结合端到端技术 复合型人才更具竞争力 [7] 人才需求现状 规控算法工程师 - 岗位职责覆盖城区/高速/停车场等多场景决策规划算法开发 需掌握MPC/PID等经典算法 [10] - 任职要求硕士以上学历 熟悉强化学习算法 有Apollo等开源项目经验者优先 [10] - 薪资范围40k-100k/月 工作地集中在北京/上海 [10] 端到端工程师 - 核心任务包括VLA模型构建、训练数据集优化及闭环评测系统研发 [12] - 薪资30k-80k/月 工作地分布在深圳/上海 [12] 视觉算法专家 - 技术要求涵盖轻图感知、占据格网络研发及视觉大模型应用开发 [18] - 优先考虑有顶会论文或算法竞赛获奖经历者 薪资40k-80k/月 [17][18]
SOTA端到端算法如何设计?CVPR'25 WOD纯视觉端到端比赛Top3技术分享~
自动驾驶之心· 2025-06-25 17:54
CVPR2025 WOD纯视觉端到端比赛结果 - 冠军方案来自EPFL团队,采用DiffusionDrive框架,结合nuPlan数据集和集成策略 [1] - 亚军方案由Nvidia & Tubingen团队提出,参考DiffusionDrive和SmartRefine,使用4个不同数据集并验证训练数据顺序的重要性 [1] - 季军方案来自韩国汉阳大学,采用简洁结构设计,仅使用前视图+自车状态输入 [1] - 特别奖方案使用QWen2 5-VL大模型生成CoT数据,在3B模型上训练 [1] 比赛背景与数据集 - 比赛聚焦长尾驾驶场景评估,包含4021个20秒驾驶片段,其中2037个用于训练 [2] - 参赛者需使用8个周围摄像头数据,在鸟瞰图坐标系下预测5秒路径点轨迹 [2] - 评分主要采用"评分反馈得分"(RFS),"平均位移误差"(ADE)作为平局判定标准 [2] 季军方案技术细节 - 采用极简主义设计Swin-Trajectory,仅使用单前置摄像头和自车历史信息 [41] - 基于Swin Transformer骨干网络,在RTX 4090上实现14ms推理速度 [41] - 使用三维位置编码为密集图像特征提供几何基础 [44] - 通过交叉注意力机制融合图像特征与路径点查询 [46] 亚军方案技术亮点 - 提出Open-X AV(OXAV)框架整合多种AV数据集 [22] - 采用两阶段训练流程:感知导向数据预训练+规划导向场景后训练 [26] - 使用ResNet34骨干网络,仅需单块A100 GPU训练一天 [26] - 模型集成显著提升RFS评分,证明聚合多个模型预测的优势 [37] 行业技术趋势 - 端到端自动驾驶方法展现出替代传统模块化架构的潜力 [2] - 跨数据集学习成为提升模型泛化能力的重要方向 [26] - 轻量化模型设计在保持性能的同时降低计算成本 [41] - 扩散模型在轨迹生成领域展现出高效性和多样性优势 [4]
海外自动驾驶专题报告:真L3加速推进与L4多场景爆发,海外自动驾驶投资风口
西南证券· 2025-06-25 17:00
报告行业投资评级 未提及 报告的核心观点 - 发展现状仅实现L2+大规模上车,真L3技术有望年内落地,L4限定场景商业模式有望跑通,头部企业有望2025年年内盈利 [3] - 技术方向催化方面,L3技术关注VLM技术量产上车和头部车企VLA模型落地,L4技术关注Robotaxi和Robovan场景,L2+、L3、L4技术需求利好核心零部件销量 [3][141] - 相关标的包括L3技术方向的全栈自研车企,L4技术方向的技术解决方案公司,以及L2+、L3、L4技术方向的核心零部件企业 [3][141] 根据相关目录分别进行总结 自动驾驶的分类和定义 - 自动驾驶分为L0 - L5共6个阶段,L0为人类手动驾驶,L1可辅助驾驶,L2可部分自动驾驶,L3可脱眼,L4可脱脑,L5为无人驾驶 [6] - 国际和国内高级别自动驾驶分级基本一致,但在责任定义上存在差异,国际标准强调企业主导,中国标准强调安全优先 [11][12] 自动驾驶的历史今生 - 自动驾驶经历早期探索、初步发展、技术突破、高速发展等阶段,未来理想引入认知模型,小鹏预计2025年年内实现L3上车,特斯拉计划2027年量产无人网约车 [14] 自动驾驶技术路线 - 技术层级包括感知端、决策段、执行端,感知端有以激光雷达为主的多传感器路线和纯视觉路线,决策段从规则算法到端到端算法,执行端从传统执行系统到线控执行系统 [20] - 算法架构从2D CNN到BEV+Transformer再到端到端算法,经历多次变革,端到端算法有显式和隐式两种落地形式 [22][36] - 端到端2.0结合生成式AI技术,特斯拉的World Model和理想的VLM认知模型可应对长尾场景,VLA正成为2025年头部车企竞逐焦点 [55][71][76] - L3和L4技术路径差异由目标场景的安全要求、责任归属和商业化逻辑决定,L3看重成本和安全权衡,L4对安全要求高 [86] 自动驾驶商业模式 - 自动驾驶技术变现方式为卖产品、卖服务、卖技术,国内外L3/L4双线并行发展,产业链相关企业均有望受益 [91][94] - L3级由全栈自研车企主导,2025年是商用元年,政策、技术和成本推动其向大众市场普及 [96] - L4四大场景包括Robotaxi、Robotruck、Robobus、Robovan,市场空间、技术壁垒、盈利情况各有不同,运营模式分为To C、To B、To G [101][113] 必争之地Robotaxi - 行业生态由技术提供方、平台运营方、整车提供方组成,营运模式有自运营模式和金三角模式 [122] - 接管频率、日均订单量、累计里程数是重要指标,Waymo接近商业化技术拐点,萝卜快跑和小马智行已实现单车盈亏平衡,萝卜快跑安全性与人类持平,Waymo超越人类 [125][126][133] 相关标的 - L3技术方向关注全栈自研车企,L4技术方向关注技术解决方案公司,L2+、L3、L4技术方向关注核心零部件企业 [3][141]
公司深度报告智驾平权“最大公约数”,乘渗透率东风加速全域征程
信达证券· 2025-05-16 08:30
报告公司投资评级 - 首次覆盖,给予“买入”评级 [3][6] 报告的核心观点 - 2025年国产OEM推出平价智驾方案推动AD渗透率提升,智驾软硬件及解决方案市场将快速发展,地平线成长潜力和投资价值凸显 [11] - 智驾市场规模高增,AD有望接棒ADAS成主流,地平线市占率和客群规模领先,新产品或打开增长空间,且有望受益于国内OEM销量增长 [5] - 地平线在ADAS到城市NOA全域覆盖有优势,BPU架构迭代提升计算效能,端到端和世界模型结合成就高阶智驾标杆,国产OEM智驾需求提升使其受益 [7] 根据相关目录分别进行总结 领军国内智驾Tier2,各大OEM智驾方案“最大公约数” - 新一代汽车智能芯片领导者和世界级AI算法公司,产品覆盖芯片平台、解决方案及配套工具链与生态,与英伟达、鸿蒙智行对比各有优劣 [14][21][24] - ADAS和AD市场规模快速扩张,软件占重要份额,国内智能汽车渗透率提升,AD占比扩大,AD有望接棒ADAS成市场主流,出海空间广阔 [26][37] - 地平线市场份额持续提升,ADAS行业领军,AD快速爬坡,在国内ADAS、ADAS+AD及全球ADAS+AD市场份额均稳步上升,受主流车企青睐 [49][57] - 国内OEM销量持续发力,地平线有望从中获益,中国OEM市场份额增加且收入高速增长,地平线产品出货量和定点车型增多,客户覆盖广,与Tier1合作打开下沉市场 [61][67][72] 从ADAS到城市NOA全域覆盖,BPU架构迭代带动计算效能倍数提高 - ADAS领域领军者,成体系的解决方案,HorizonMono适配不同芯片支持多种驾驶辅助技术,HorizonPilot覆盖全国高速,HorizonSuperDrive迈向高端市场 [74][78][81] - 算力之外,FPS更能体现软硬件的实际表现,征程5的MAPS跑分高,软硬优化助力车厂落地自动驾驶方案 [89] - 自研BPU计算架构,高效率支持Transfomer算法,从伯努利到纳什架构计算性能提升显著,J6P+端到端成就高阶智驾标杆 [93][99][105] 端到端和世界模型,软硬件耦合成就高阶智驾新标杆 - 端到端技术的先行者,软硬一体或为智驾终局的标准答案,2016年提出端到端演进理念,打造纳什BPU实现软硬协同 [110] - 端到端配合世界模型,同时提高上限和下限,世界模型可输出对驾驶环境的理解,提升数据驱动替代程度,通过交互式博弈实现性能提升和场景泛化 [116][121][126] - 从规则驱动到数据驱动,实际带来直观改善,世界模型为端到端路线减负加速,让高阶智驾全场景覆盖,HSD图形化界面有拟真效果 [129] 从天神之眼到千里浩瀚,国产OEM智驾需求显著提升 - 地平线深度参与各大主机厂发起的智驾平权战略,征程6P及HSD将量产,多家主机厂采用其方案,出货量级与渗透率齐升推动智驾普及 [131][150] - 特斯拉FSD入华,有望加剧全行业在智驾能力上的角逐,虽搅动竞争格局加速普及,但与地平线客群竞争交集小 [151][152] - 性价比、软件能力、定制化及响应能力,三大优势奠定行业地位,J6M在中阶算力芯片和解决方案领域有优势,推动辅助驾驶向大众市场渗透 [156][159] - 收入增长带动费用及成本摊薄,财务表现逐步向好,2022 - 2024年营收高速增长,研发费用占比下降,解决方案+授权服务收入为主要来源,商业模式具持续性 [162][169][177] 盈利预测、估值与投资评级 - 盈利预测及假设,汽车产品解决方案、汽车解决方案 - 授权及服务业务、非车解决方案业务2025 - 2027年均有望实现不同程度增长,毛利率有相应变化 [183][184] - 估值与投资评级,首次覆盖给予“买入”评级,预计2025 - 2027年营业收入为36.10/56.97/80.53亿元,同比增长51%/58%/41%;归母净利润为 - 13.14/-7.74/6.68亿元,对应当前股价PS分别为24/15/11倍 [6]