端到端算法
搜索文档
端到端落地小班课:核心算法&实战讲解(7个project)
自动驾驶之心· 2025-12-10 03:00
行业招聘与技能需求趋势 - 自动驾驶行业招聘需求正发生变化,两年前热门的感知岗位需求进一步收缩,当前需求较高的方向集中在端到端、VLA(视觉语言动作模型)、世界模型等领域 [2] - 头部玩家已验证端到端技术路径可行,其他车企正跟进投入资源,从模型优化、场景优化、数据优化到下游的规划兜底方案 [2] - 市场对候选人的技术要求更广,涉及导航信息引入、强化学习调优、轨迹建模与优化等具体量产经验,但目前候选人往往只精通部分领域 [2] 端到端自动驾驶技术核心 - 端到端系统正成为主流,其核心在于合并感知任务并使规控(规划与控制)算法学习化,取代传统的感知、地图、规控等多模块分立系统 [7] - 技术框架主要分为两段式与一段式:两段式框架涉及感知与PNC(规划、导航与控制)的信息传递;一段式框架可实现信息无损传递,性能通常更优,具体方案包括基于VLA和基于扩散模型的方法 [8][9] - 导航信息是关键要素,起引导、选路、选道作用,其在地图中的编码与嵌入方式是发挥效力的重点 [10] - 纯模仿学习存在局限,需结合强化学习以处理人类驾驶风格差异和罕见场景,使系统学习因果关系并实现泛化 [11] - 量产落地需规划兜底方案,通过时空联合规划等后处理逻辑对模型输出轨迹进行平滑优化,以保证稳定可靠 [13] 量产实践与课程内容映射 - 面向量产的端到端实战涉及多个核心算法,包括:一段式/两段式端到端、导航信息量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等 [2] - 量产经验分享涵盖数据、模型、场景、规则等多视角,旨在提供解决实际问题的工具与策略,以快速提升系统能力边界 [14] - 相关实战课程设计为期三个月,从任务概述、算法框架、RL算法、轨迹优化到兜底方案与经验分享,层层展开 [2][7][8][9][10][11][12][13][14]
端到端岗位求职:核心算法&实战讲解(7个project)
自动驾驶之心· 2025-12-08 08:02
行业招聘与技能需求变化 - 自动驾驶行业招聘需求正发生变化,两年前热门的感知岗位需求进一步收缩 [2] - 当前行业需求较高的方向集中在端到端、VLA(视觉语言动作模型)、世界模型等领域 [2] - 头部玩家已验证端到端技术路径可行,其他车企正跟进投入模型、场景、数据优化及规划兜底等方面的人力和资源 [2] - 市场面临人才技能与岗位需求不匹配的挑战,相关岗位技术栈广泛,但候选人往往只精通部分领域 [2] - 具体的量产经验,如导航信息引入、强化学习调优、轨迹建模与优化等,是实际落地中的关键痛点 [2] 课程核心内容与结构 - 课程名称为《面向量产的端到端实战小班课》,核心重点是聚焦量产应用 [2] - 课程设计历时三个月,内容从实战到落地层层展开 [2] - 课程涵盖核心算法包括:一段式端到端、两段式端到端、导航信息的量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等 [2] - 课程最终会分享实际的量产经验 [2] - 课程采用小班教学模式,仅剩20个招生名额 [2][4] - 课程面向进阶学员,建议具备自动驾驶BEV感知、视觉Transformer、端到端算法、强化学习、扩散模型理论基础,以及Python、PyTorch、mmdet3d框架等技能基础 [16] - 课程为离线视频教学,辅以VIP群答疑和三次线上答疑,开课时间为11月30日,预计三个月结课 [15][17] 技术发展趋势与课程章节详解 - **端到端任务概述**:在端到端时代,感知任务合并与规控算法学习化已成为绝对主流,如何高效合并感知任务及设计学习化规控模块是行业核心技能 [7] - **两段式端到端算法**:章节介绍两段式框架的建模方式、感知与规划控制的信息传递,分析其优缺点,并通过PLUTO算法进行实战讲解 [8] - **一段式端到端算法**:一段式框架可实现信息无损传递,性能上优于两段式方案,章节将学习基于VLA、扩散模型等多种方案,并以VAD系列进行深入教学 [9] - **导航信息的量产应用**:导航信息在自动驾驶中起引导、选路、选道作用,章节介绍主流导航地图格式、内容及其在端到端模型中的编码与嵌入方式 [10] - **自动驾驶中的强化学习算法**:纯模仿学习存在局限,需结合强化学习以学习因果关系并实现泛化,章节重点介绍强化学习算法及其训练策略 [11] - **端到端轨迹输出优化**:章节进行NN Planner项目实战,涵盖基于模仿学习的扩散模型与自回归算法,以及在监督微调后结合强化学习的实战 [12] - **兜底方案-时空联合规划**:为应对模型输出非100%准确,量产需轨迹平滑优化等后处理兜底逻辑,章节介绍多模态轨迹打分搜索及轨迹平滑算法 [13] - **端到端量产经验分享**:最终章节从数据、模型、场景、规则等多视角分享量产经验,剖析如何选用合适工具与策略以提升系统能力边界 [14] 讲师背景 - 讲师王路拥有C9本科和QS50高校博士学位,已发表若干CCF-A和CCF-B论文 [4] - 现任国内顶级Tier1供应商算法专家,从事大模型、世界模型等前沿算法的预研与量产工作 [4] - 所研发算法已成功落地并量产,拥有丰富的端到端算法研发和实战经验 [4]
汽车智能化系列专题之决策篇(7):各厂商技术持续突破,robotaxi商业化进展迎拐点
国信证券· 2025-12-03 19:58
行业投资评级 - 行业投资评级:优于大市(维持评级)[1] 核心观点 - 国内外政策逐步落地,智能驾驶高速发展是必然趋势[2] - 特斯拉与华为“端到端”算法引领技术突破,华为城市NOA覆盖率已达99.56%[2] - 比亚迪推动“智驾平权”,2025年高速NOA渗透率有望从11.3%增至39.0%,城市NOA渗透率从6.1%增至9.6%[2][41] - 伴随硬件成本下降和国产芯片崛起,智驾功能加速向10-20万元车型市场下沉[2][45] - Robotaxi全球市场潜力近10万亿元,Waymo与Apollo为领域领航者,商业化进程持续加速[2][115] 智驾规范:各方政策逐步落地 - 国家政策积极推动L3商用部署和L4技术探索,构建标准体系并鼓励示范应用[6][7] - 地方政府如北京、上海、广州、深圳积极探索应用场景,聚焦权责划分并进入试点阶段[6][7] - 海外政策不断完善高级别智驾安全条例,并以美国、日本为代表积极提升渗透率,拓宽使用场景[9][11] 高端智驾:特斯拉与华为端到端技术 - 特斯拉FSD V13采用火箭同源代码,实现从停车场直接启动的全程自动驾驶[16][17] - 特斯拉FSD V12采用端到端神经网络模型,优化30万行代码,实现数据收集到反应的自动化[16][17] - 华为ADS 3.0实现业界首发“车位到车位”智驾领航NCA功能,城市NCA覆盖率高达99.56%[19][20] - 华为ADS 3.0采用GOD大网与PDP网络结合的端到端算法,复杂路口通过率超过96%[19][20] 智驾平权:2025年智驾渗透率拐点 - 比亚迪智驾研发采取自研+合作模式,高阶系统“天神之眼”实现全国无图城市领航功能开通[24] - 比亚迪将中阶智驾市场下沉至10万元级车型,部分车型智驾版价格下探至7.98万元[26][29] - DeepSeek大模型接入降低车端算力需求和芯片部署成本,推进中阶智驾功能下放[30][32] - 国内各类车企积极布局L3产品,比亚迪智驾版预计2025年覆盖全系车型[34][35] - 比亚迪智能驾驶硬件配置呈现高低分层趋势,高端车型具备L3级能力[37][38] 产业链及零部件厂商分析 - 智驾芯片市场向SoC过渡,英伟达Orin-X算力达254 TOPS,Thor-X算力达1000 TOPS[50][51] - 英伟达以42%份额主导国内市场,地平线、华为为国产龙头,份额分别为10%和9%[53][56] - 比亚迪“天神之眼”计划拉动芯片市场需求,预计2025年市场规模达15.8亿美元,较2024年增长37%[59][63] - 激光雷达市场100%由本土厂商构成,2024年装机量超150万颗,速腾聚创与华为技术份额领先[69][72] - 预计2025年激光雷达市场规模达8亿美元,较2024年增长62%,禾赛科技市占率预期达31%[76][77] - 毫米波雷达市场规模预计2025年超10000万颗,本土企业立讯精密、德赛西威份额提升[84][95] - 车载摄像头市场年均复合增长率达21.31%,2025年前装市场规模预计达1.2亿颗[97][98] - 韦尔股份与舜宇光学约30%-40%利润来自ADAS业务,受益于功能下沉至10万元以下车型[103] Robotaxi:智能驾驶最佳商业化场景 - Robotaxi是基于L4/L5技术的出行服务,集成传感器、AI算法等实现完全自主驾驶[112][114] - 全球市场潜力广阔,乐观预计2030年市场规模可达9.06万亿元[115] - 中国和美国处于商业化第一梯队,Waymo与Apollo为领域领航者[116][121] - Pony AI已实现全市范围运营成本盈亏,目标2025年车队超1000辆;WeRide目标2030年部署十万辆[2]
最近,自动驾驶的岗位招聘有一些新的变化......
自动驾驶之心· 2025-12-03 08:04
自动驾驶行业招聘趋势变化 - 感知岗位需求进一步收缩,而端到端、VLA、世界模型等方向需求较高 [1] - 头部玩家已验证端到端路径可行,其他车企正跟进模型优化、场景优化、数据优化及规划兜底等资源投入 [1] - 候选人技术栈狭窄,缺乏导航信息引入、强化学习调优、轨迹建模等量产经验,成为实际落地痛点 [1] 端到端量产课程核心内容 - 课程聚焦量产实战,涵盖一段式端到端、两段式端到端、导航信息应用、强化学习、扩散模型+强化学习等核心算法 [1][2] - 课程设计基于实际量产需求,包括轨迹优化、兜底方案及量产经验分享,仅限25名学员参与 [2][3] - 讲师为顶级Tier1算法专家,具备大模型、世界模型等前沿算法预研和量产落地经验 [3] 课程大纲与技术模块 - 第一章介绍感知任务合并与规控学习化趋势,分析主流一体化架构及开源数据集评测方式 [6] - 第二、三章对比两段式与一段式端到端框架,分别讲解PLUTO算法实战和VAD系列方法,强调一段式方案性能更优 [7][8] - 第四至七章深入导航信息编码、强化学习泛化训练、轨迹输出优化及时空联合规划兜底方案,覆盖模仿学习与强化学习结合应用 [9][10][11][12] - 第八章从数据、模型、场景等多视角分享量产经验,提升系统能力边界 [13] 课程安排与学员基础要求 - 课程周期为三个月,自11月30日起分章节解锁教学,包含离线视频与三次线上答疑 [14][16] - 学员需自备GPU(推荐算力4090及以上),熟悉BEV感知、Transformer、强化学习等算法,具备Python/PyTorch及数学基础 [15]
即将开课!面向量产的端到端小班课,上岸高阶算法岗位~
自动驾驶之心· 2025-11-27 08:04
课程核心定位 - 课程聚焦于自动驾驶领域端到端技术的量产化实战应用,旨在解决行业量产人才稀缺的问题 [1] - 课程设计历时三个月,内容涵盖从模型优化、场景优化、数据优化到下游规划兜底的全栈技能 [1] - 课程由自动驾驶之心联合工业界算法专家开设,重点为面向就业直击落地,目前仅剩35个招生名额 [3][5] 核心算法与技术内容 - 课程涉及的核心算法包括一段式端到端、两段式端到端、导航信息的量产应用、开闭环强化学习等 [3] - 技术组合涵盖扩散模型+强化学习、自回归+强化学习、时空联合规划等前沿方法 [3] - 课程最后将分享实际的量产经验,帮助学员构建完整的量产优化知识体系 [3] 讲师背景 - 讲师王路拥有C9本科和QS50 PhD学历,已发表多篇CCF-A和CCF-B论文 [6] - 现任国内顶级tier1公司算法专家,从事大模型、世界模型等前沿算法的预研和量产工作 [6] - 所研发算法已成功落地并量产,拥有丰富的端到端算法研发和实战经验 [6] 课程大纲详解 - 第一章介绍主流感知模型一体化架构和经典规控learning化方案,以及开源数据集和评测方式 [9] - 第二章讲解两段式端到端算法框架,包括建模方式、感知与PNC信息传递,并通过PLUTO算法实战 [10] - 第三章深入一段式端到端框架,涵盖基于VLA和diffusion的方法,重点学习VAD系列 [11] - 第四章专注导航信息的量产应用,包括导航地图格式、编码嵌入方式及能力发挥 [12] - 第五章从模仿学习过渡到强化学习,重点介绍RL算法及其训练策略以解决corner-case场景 [13] - 第六章进行nn planner项目实战,结合模仿学习与强化学习,重点讲解扩散模型和自回归算法 [14] - 第七章介绍时空联合规划等轨迹平滑优化算法,作为模型直出的兜底方案确保轨迹稳定可靠 [15] - 第八章从数据、模型、场景、规则多视角分享量产经验,提升系统能力边界 [16] 课程安排与学员要求 - 课程于11月30日开课,预计三个月结课,采用离线视频教学加VIP群答疑模式 [17] - 学员需自备GPU,推荐算力在4090及以上,并具备BEV感知、视觉Transformer等算法基础 [18] - 要求掌握强化学习、扩散模型理论基础,熟悉Python、PyTorch及mmdet3d算法框架 [18] - 需要一定的高等数学、线性代数和矩阵论基础,课程按周解锁章节,持续至次年2月底 [19]
工业界算法专家带队!面向落地的端到端自动驾驶小班课
自动驾驶之心· 2025-11-21 08:04
端到端自动驾驶技术行业需求与挑战 - 端到端技术已成为车企量产核心招聘岗位 但市场上面向量产的真正人才极为稀缺[1] - 端到端岗位要求全栈能力 涵盖模型优化 场景优化 数据优化以及下游规划兜底等多个环节[1] - 行业当前需攻克导航信息引入 强化学习调优 轨迹建模与优化等量产一线难题[3] 端到端量产课程核心内容 - 课程设计历时三个月 聚焦从实战到落地的进阶内容[3] - 核心算法覆盖一段式端到端 两段式端到端 导航信息量产应用 开闭环强化学习 扩散模型+强化学习 自回归+强化学习 时空联合规划等[5] - 课程重点在于面向就业与直击落地 仅开放35个招生名额[5] 课程详细大纲 - 第一章:介绍感知模型一体化架构与规控学习化方案 分析任务合并与模块设计[10] - 第二章:讲解两段式框架建模 感知与PNC信息传递 优缺点 并以PLUTO算法实战[11] - 第三章:分析一段式框架优势 学习VLA VAD等基于diffusion的方法 实现信息无损传递[12] - 第四章:解析导航地图格式 内容 及其在端到端模型中的编码与嵌入方式[13] - 第五章:从模仿学习过渡到强化学习 讲解RL算法及训练策略以解决场景泛化问题[14] - 第六章:进行nn planner项目实战 结合模仿学习与强化学习 涵盖扩散模型与自回归算法[15] - 第七章:介绍时空联合规划等轨迹平滑优化算法 作为模型输出不准时的兜底方案[16] - 第八章:分享数据 模型 场景 规则等多视角的量产经验 提升系统能力边界[17] 课程师资与安排 - 讲师王路拥有C9本科及QS50 PhD背景 发表多篇CCF-A/B论文 现任国内顶级Tier1算法专家 具备大模型 世界模型等前沿算法预研与量产经验[6] - 课程面向具备BEV感知 视觉Transformer 强化学习 扩散模型 Python/PyTorch等基础的进阶学员 需自备4090及以上算力GPU[18][19] - 课程采用离线视频教学 辅以VIP群答疑及三次线上答疑 自11月30日开课 预计三个月结课 按周解锁各章节内容[20]
智驾软硬件持续迭代,robotaxi未来已来
2025-11-03 10:35
行业与公司概览 * 纪要涉及的行业为智能驾驶(智驾)行业,包括高级辅助驾驶(L2/L2+)和全自动驾驶(L4/Robotaxi)领域 [1] * 纪要重点讨论的第三方智驾软件供应商包括Momenta、华为、大疆(卓翼)、地平线、元戎启行 [3] 市场格局与公司能力 * Momenta在第三方智驾市场占据领先地位,份额达55%,华为占25% [1][3] * Momenta提供单Orin X和双Orin X两种方案,覆盖从比亚迪、智己到奇瑞等不同车型,展现其工程化和算法裁剪能力 [1][3] * 华为凭借强大的体验和工程化能力,支持多款车型、自研芯片及大规模路侧泛化,但其顶尖算力芯片目前主要用于ADS 4.0 Ultra版本 [3] * 大疆在低算力芯片(如TI TDA4)解决方案上工程化能力出众,但市场对低算力芯片(32 TOPS或100 TOPS以下)的需求正在转向中高算力方案 [1][4] * 地平线采用自研软硬一体化方案(如HSD及G6P系列),已在奇瑞星途车型上量产,但受限于NPU算力及迭代升级,整体效果仍需提升,需更多车型验证工程化能力 [1][6] * 元戎启行主要集中在城市NOA,基于英伟达平台开发并与长城汽车合作紧密,其算法开发能力领先但工程化能力相对较弱 [7] 技术路线与核心观点 * 当前智驾行业技术路线主要分为三类:端到端算法(代表企业有Momenta、特斯拉、极氪)、VLA模型(代表企业有理想、小鹏)以及世界模型(华为、Momenta、地平线等正在开发) [2] * 车企智驾能力差异主要由算法、数据和算力三大因素决定,短期内算法调整效果明显,长期来看数据积累是关键,高效训练依赖强大计算资源 [8][9] * 长期看,若厂商继续沿用当前技术路线(如Transformer),智驾能力差异将逐渐收敛,数据积累达到一定规模(如特斯拉的50亿英里)后会出现数据饱和效应 [10] * 在感知硬件路线上,融合感知路线(结合激光雷达)比纯视觉更具长期优势,原因包括激光雷达成本已降至200多美元、数据处理技术提升能应对复杂场景、新法规对障碍物检测提出更高要求 [12] * L2+公司向L4发展更具优势,过渡自然且资源投入较少,但挑战在于全域泛化能力和量产一致性 [1][20] 芯片架构与发展需求 * 下一代智能驾驶芯片需求包括:强大的GPU/NPU以支持VLA和世界模型等高级功能、高带宽(未来可能需要从当前290GB/s翻倍或增至1.5倍)、工艺与功耗平衡(如3纳米或5纳米)、增加内存容量 [14][15] * 不同级别自动驾驶的算力需求:L2级需5-10 TOPS,增加泊车功能需约16 TOPS;L2++(高速辅助驾驶)需30-100 TOPS;L3级需500 TOPS以上;L4级普遍认为需1,000 TOPS以上 [16] * 对于L3及以上级别,冗余设计变得重要,例如采用双Orin芯片配置以备未来升级 [16] * 智能驾驶芯片与机器人芯片平台差异不大,许多厂商借鉴共用平台以降低成本 [17] Robotaxi商业化前景 * Robotaxi市场是一个正能性市场,不完全依赖技术驱动,关键在于提高场景内车辆通行效率和减少远程接管及事故率 [18] * 实现盈亏平衡需区域扩展足够大且定价合理,主要成本来自车辆折旧(如小马智行第六代车成本高达60万人民币),可通过定制化、换电等方式降本,同时需确保价格竞争力和扩大行驶里程覆盖范围以提高收入 [19] 其他重要细节 * VLA技术对智能驾驶体验的提升主要集中在功能创新(如自动前进/后退)和对带有语义信息的环境理解能力上,提高了决策合理性和流畅性 [11] * 大多数第三方算法公司(如Momenta、元戎启行)更倾向于开发通用算法并进行跨平台适配,而非与特定芯片厂商深度绑定,软硬件耦合较深的主要是同时提供软硬件解决方案的公司(如华为、地平线) [13]
开学了,需要一个报团取暖的自驾学习社区...
自动驾驶之心· 2025-09-05 07:33
自动驾驶行业招聘与求职 - 金九银十为秋招关键期 业内tier 1公司已开始发放测试岗位offer 但部分求职者仍希望冲刺算法岗[1] - 行业招聘需求集中在感知算法、端到端自动驾驶、4D标注、多模态大模型等前沿方向[7][11][14] - 主流车企与科技公司包括理想、地平线、百度、上海人工智能实验室、蔚来、小鹏、华为车BU、大疆等均开放岗位[38] - 课程学员可获得直接推荐至算法开发负责人的机会 绕过官网投递流程[38] 自动驾驶技术发展趋势 - 端到端自动驾驶成为智驾量产核心算法 分为一段式与二段式技术方向 理想汽车已宣布E2E+VLM双系统架构量产[7] - 2024年端到端技术需融合多模态大模型、BEV感知、强化学习、视觉Transformer、扩散模型等多领域知识[8] - 4D自动标注算法需求激增 因端到端训练需时间同步后的传感器统一标注动静态元素、OCC和轨迹等[11] - 多模态大模型与自动驾驶结合成为新兴领域 学术界论文爆发 工业界融资案例快速增长[14] 专业培训课程体系 - 推出299元超级折扣卡 一年期内享受全平台课程七折优惠[4][6] - 开设端到端与VLA自动驾驶小班课 涵盖多模态大模型、BEV感知、强化学习等核心技术[7][8] - 4D自动标注算法就业小班课聚焦数据闭环算法开发与工程化落地[11][12] - 多模态大模型实战课程系统化覆盖从通用模型到端到端自动驾驶应用[14][15] - 感知系列课程包括BEV感知全栈、毫米波雷达视觉融合、激光雷达视觉融合等16个模块[16] - 规划控制与预测课程包含轨迹预测理论与实战、规划控制小班课等[18] - 模型部署课程涵盖CUDA与TensorRT部署、BEV模型部署实战[18] 硬件与科研平台 - 全栈教研平台黑武士001支持全流程开发[4][43] - 足式/强化学习科研平台TRON1针对进阶研究[4][43] - 四足机械狗+机械臂科研平台整合运动控制与操作[4][43] - 桌面级机械臂科研平台适用于轻量级实验[4][43] - 数采夹爪提供单臂与双臂方案 支持数据采集任务[4][43] 学习与交流机制 - 每门课程配备专属VIP交流群 主讲老师每日群内交流并定期直播答疑[26] - 重点解决小白常踩坑问题、工程常见问题及后续研究方向[26] - 实际讨论内容涵盖模型微调(如Florence2)、TensorRT部署、多模态数据标注等实操问题[28][29][32] 工程实践与挑战 - 车端部署需满足低于100毫秒响应时间的理想目标 复杂场景要求成功率99.9%以上[34] - 转向角误差需小于1度(理想目标)或2度(可接受范围)[34] - 加速制动误差需小于0.1 m/s²(理想目标)或0.2 m/s²(可接受范围)[34] - 传感器升级(如相机200万→800万像素)可能需重构数据集与模型重新训练[36] - 多传感器联合标定采用在线标定与优化结合方式 依赖高精地图投影验证精度[36]
小鹏加码主动安全:CEO 下场动员,想用技术成果回应外界质疑
晚点Auto· 2025-08-31 19:59
核心观点 - 主动安全已成为智能电动车技术竞赛的新焦点 公司通过重写主动安全架构和代码 实现每日迭代更新 以重新进入主动安全第一梯队[2] - 公司采用纯视觉方案 通过端到端+NGP架构提升主动安全性能 实现130公里/时全速域AEB和行业唯一的低附着路面AES功能[4][7][19] - 团队通过设立急战室和每日迭代的开发模式 在半年内完成主动安全系统升级 以应对市场竞争和用户对安全功能的需求[15][16][13] 技术突破 - AEB系统覆盖0-150公里/时全速域 针对静止障碍物在130公里/时高速下实现两段式刹停 先以0.6-0.7G减速度提醒 再以1G减速度紧急制动[4] - 冰雪AES功能通过单边制动技术 在80-130公里时速范围内实现紧急转向避让 解决低附着系数路面(低于0.3)的车辆控制问题[7][8] - 视觉摄像头采用24Hz帧率 响应速度达主流激光雷达的2倍 端到端模型延时降低一半[19] 开发过程 - 组建跨部门团队(智驾+底盘)进行技术融合 通过实车测试验证单边制动等创新方案[9][10] - 在广州和上海设立急战室 实行每日版本迭代和每周例会机制 确保开发进度和质量控制[15][16] - 使用累计的庞大数据库(含标签数据)进行模型训练 道路测试超60万公里 并辅以云端仿真测试[20] 行业背景 - 行业从基础AEB功能转向高速/夜间/极端天气等复杂场景的性能竞争 AEB成为衡量智能辅助驾驶能力的新标尺[3] - 端到端算法应用趋于成熟 可提升场景识别准确率和驾驶行为拟人化 公司采用该架构重写AEB代码[18][19] - 纯视觉与多传感器融合路线存在争议 但公司通过纯视觉方案实现主动安全性能提升[12][19] 战略意义 - 主动安全被列为公司"五大战役"之一 获得高层直接关注和资源倾斜 包括算力分配和人员调配[13][17] - 技术显性化需求增强 需通过突破性功能(如冰雪AES)强化智能驾驶标签 应对行业竞争压力[14] - 优先解决高频高严重度场景(如车辆/行人/施工障碍) 终极目标为实现零碰撞的全场景覆盖[21][22]
从零开始!自动驾驶端到端与VLA学习路线图~
自动驾驶之心· 2025-08-25 07:32
端到端与VLA自动驾驶技术发展 - 端到端自动驾驶技术涉及多模态大模型、BEV感知、强化学习、视觉Transformer、扩散模型等多个领域技术栈 [32] - 技术发展从模块化方法演进至端到端范式 包括一段式、二段式和VLA范式 [36] - VLA(视觉语言动作)成为当前端到端自动驾驶的皇冠技术 上限高且业内招聘需求旺盛 [46] Transformer与大语言模型基础 - Transformer架构核心是注意力机制和多头注意力 通过基础模块堆叠形成Encoder和Decoder [11][13] - Token化采用BPE、Word-Piece等方法 通过合并高频字符实现压缩 [9][13] - 位置编码使用正弦和余弦函数 使模型记住词序且位置偏移量与当前位置呈线性关系 [9][13] 视觉与语言模型对齐技术 - CLIP是视觉与大模型对齐的广为认知的技术 为多模态大模型奠定基础 [18] - 视觉Transformer扩展了Transformer的基本概念 成为多模态模型重要组成部分 [43] - LLAVA等模型进一步推进了视觉语言模型的发展 [43] 课程内容体系设计 - 第一章介绍端到端算法发展历史、范式优缺点及学术界工业界动态 [36] - 第二章重点讲解大语言模型、BEV感知、扩散模型、强化学习等背景知识 [37][43] - 第三章分析二段式端到端 涵盖经典算法PLUTO、CVPR'25的CarPlanner和最新Plan-R1 [38] - 第四章深入一段式端到端子领域:基于感知的UniAD、基于世界模型的Drive-OccWorld、基于扩散模型的DiffusionDrive及基于VLA的ORION [39][41][44][46] - 第五章设置RLHF微调大作业 实现从理论到实践的完整闭环 [48] 技术人才市场需求 - VLA/VLM大模型算法专家岗位薪资达40-70K-15薪 要求3-5年经验硕士学历 [29] - VLA/VLM/LLM算法工程师薪资40-70K-15薪 不限经验但要求深度学习机器学习背景 [29] - VIA模型量化部署工程师薪资40-60K-15薪 要求1-3年经验及模型加速技能 [29] 课程特色与优势 - 采用Just-in-Time Learning理念 通过通俗语言和案例快速掌握核心技术栈 [33] - 帮助学员梳理研究发展脉络 形成自己的研究体系和工作经验 [34] - 配备实战环节包括Diffusion Planner和ORION开源推理评测模块 [44][46] - 学员结课后可达1年左右端到端自动驾驶算法工程师水平 [53] 讲师资质与课程安排 - 讲师Jason为C9本科+QS50 PHD 发表CCF-A论文2篇 现任TOP主机厂算法专家 [24][49] - 课程8月15日开课 预计三个月结课 采用离线视频教学+vip群答疑模式 [52] - 章节解锁时间安排:第一章8月01日、第二章8月15日、第三章8月30日、第四章9月15日、第五章10月30日 [53]