端到端算法
搜索文档
地平线冲进 10 万级市场,认为智驾是新时代的 “自动挡”
晚点Auto· 2025-12-10 23:45
地平线的战略目标与市场定位 - 公司提出新目标:基于单征程6M芯片,为售价最低7万元的车型提供城区辅助驾驶方案,实现跟车、变道、超车等接近人类驾驶风格的功能 [3] - 公司计划在未来三到五年,通过与博世、元戎启行、轻舟智航、大众等厂商合作,推动其自研智驾算法HSD达成千万套量产规模 [3] - 公司瞄准13万元以下车型市场,该价格区间在今年前三季度占中国乘用车市场约50%份额,但基本不具备城区辅助驾驶功能 [3] 市场机会与竞争格局 - 10万元以下价格区间此前鲜有厂商涉足高阶城区智驾,主要受限于苛刻的芯片算力、算力利用率、算法模型条件以及用户对价格高度敏感 [3] - 公司提出“在没有竞争的地方竞争”的策略,当前搭载两颗英伟达Orin-X芯片最便宜的车型售价也达到12.98万元 [4] - 公司面临来自智驾供应商Momenta(芯片自研进展迅速)和高通(8775P芯片已有量产客户)的竞争 [4] - 行业头部厂商发展道路趋同,均走向软硬一体、极致降本,为更主流车型提供全栈解决方案 [9] 技术路径与产品战略 - 公司将高阶城区辅助驾驶比作新时代的“自动挡”,认为其应是汽车的基本素质而非情绪价值 [4] - 实现愿景面临双重门槛:在7万元车型上复刻25万元车型的智驾体验,同时守住成本红线,前者考验算法与工程能力,后者依赖规模效应 [4] - 公司从过去的“国产替代”追赶英伟达路线,转向开发更广阔的市场需求,以尽快扩大市场份额获得规模优势 [10] - 公司计划坚持每一代芯片和产品实现十倍算力提升、十倍模型容量叠加,其第五代芯片征程7系列计划与特斯拉下一代AI5芯片同步推出 [10] 征程6系列芯片的关键作用 - 征程6系列是让公司上智驾牌桌的重要产品,其征程6M芯片可实现城市NOA,征程6P算力达560 TOPS [11] - 该系列芯片提前预判市场需求,适配Transformer架构和“端到端”算法,以支持城市NOA [11] - 公司CEO修正了此前判断,认为随着端到端等新算法框架出现,智能驾驶行业将在2025年迎来拐点,并展望“3年实现脱手开、5年实现闭眼开、10年实现随心开” [11] - HSD智驾方案的千万套出货目标能否实现,主要取决于征程6系列的上车表现 [10] - 公司自研并开放HSD方案,旨在提高HSD出货量,因为有能力基于征程芯片自研城市NOA的供应商是少数 [10]
世界模型自动驾驶小班课!特斯拉世界模型、视频&OCC生成速通
自动驾驶之心· 2025-12-10 03:00
课程核心定位 - 课程为自动驾驶领域首个面向端到端自动驾驶的进阶实战教程,旨在推动端到端技术在工业界的落地,并助力学员深入理解端到端自动驾驶 [11] - 课程聚焦于通用世界模型、视频生成、OCC生成等世界模型算法,涵盖特斯拉世界模型、李飞飞团队Marble等前沿工作 [1] - 课程由工业界专家授课,内容基于讲师丰富的端到端算法研发和量产实战经验 [3] 讲师背景 - 讲师Jason拥有C9本科和QS50高校的博士学位,已发表多篇CCF-A/B类论文 [3] - 现任国内顶级主机厂算法专家,从事端到端、大模型、世界模型等前沿算法的预研和量产,并已主持完成多项自动驾驶感知和端到端算法的产品量产交付 [3] 课程大纲与内容结构 - **第一章:世界模型介绍** 复盘世界模型与端到端自动驾驶的联系,讲解其发展历史、应用案例、不同技术流派(如纯仿真、仿真+Planning、生成传感器输入等)及其在业界解决的问题和所处环节,并介绍相关数据集与评测 [6] - **第二章:世界模型的背景知识** 讲解世界模型的基础知识,包括场景表征、Transformer、BEV感知等,这些内容是当前世界模型求职面试频率最高的技术关键词 [6][7] - **第三章:通用世界模型探讨** 聚焦通用世界模型及近期热门工作,详细讲解李飞飞团队的Marble、DeepMind的Genie 3、Meta的JEPA、导航世界模型,以及VLA+世界模型算法DriveVLA-W0和特斯拉ICCV分享的世界模型模拟器 [7] - **第四章:基于视频生成的世界模型** 聚焦视频生成类世界模型算法,讲解Wayve的GAIA-1 & GAIA-2、上海交通大学的UniScene、商汤的OpenDWM、中科大的InstaDrive等经典与前沿工作,并以商汤开源的OpenDWM进行实战 [8] - **第五章:基于OCC的世界模型** 聚焦OCC生成类世界模型算法,包含三大论文讲解和一个项目实战,此类方法可扩展至自车轨迹规划,进而实现端到端 [9] - **第六章:世界模型岗位专题** 基于前五章算法基础,分享工业界应用经验、行业痛点、期望解决的问题,以及相关岗位面试准备与公司关注重点 [10] 关键技术覆盖与学后收获 - **关键技术覆盖** 课程将详细讲解Transformer、视觉Transformer、CLIP、LLaVA、BEV感知、占用网络、扩散模型、闭环仿真、NeRF、3DGS、VAE、GAN及Next Token Prediction等生成式模型 [12] - **核心算法掌握** 学员将掌握世界模型技术进展,涵盖视频生成、OCC生成等方法,并对BEV感知、多模态大模型、3DGS、扩散模型等关键技术有更深刻了解 [14] - **实战能力目标** 学员学完后能够复现II-World、OpenDWM等主流算法框架,能够将所学应用到项目中,设计自己的世界模型,达到约1年经验的自动驾驶算法工程师水平 [14] - **职业发展受益** 课程内容对实习、校招、社招均有助益 [14] 课程进度与安排 - 课程于1月1日开课,预计两个半月结课,采用离线视频教学,并提供VIP群答疑及三次线上答疑,答疑服务截止2026年12月31日 [15] - 各章节解锁时间安排如下:第一章于12月10日解锁,第二章于1月1日解锁,第三章于1月20日解锁,第四章于2月4日解锁,第五章于2月24日解锁,第六章于3月1日解锁 [16] 面向人群与先修要求 - **面向人群** 课程面向具备一定自动驾驶领域基础,熟悉基本模块的学员 [14] - **先修知识要求** 学员需了解transformer大模型、扩散模型、BEV感知等基本概念,具备一定的概率论、线性代数基础,以及Python和PyTorch编程能力 [14] - **硬件要求** 学员需要自备GPU,推荐算力在RTX 4090及以上 [14]
端到端落地小班课:核心算法&实战讲解(7个project)
自动驾驶之心· 2025-12-10 03:00
行业招聘与技能需求趋势 - 自动驾驶行业招聘需求正发生变化,两年前热门的感知岗位需求进一步收缩,当前需求较高的方向集中在端到端、VLA(视觉语言动作模型)、世界模型等领域 [2] - 头部玩家已验证端到端技术路径可行,其他车企正跟进投入资源,从模型优化、场景优化、数据优化到下游的规划兜底方案 [2] - 市场对候选人的技术要求更广,涉及导航信息引入、强化学习调优、轨迹建模与优化等具体量产经验,但目前候选人往往只精通部分领域 [2] 端到端自动驾驶技术核心 - 端到端系统正成为主流,其核心在于合并感知任务并使规控(规划与控制)算法学习化,取代传统的感知、地图、规控等多模块分立系统 [7] - 技术框架主要分为两段式与一段式:两段式框架涉及感知与PNC(规划、导航与控制)的信息传递;一段式框架可实现信息无损传递,性能通常更优,具体方案包括基于VLA和基于扩散模型的方法 [8][9] - 导航信息是关键要素,起引导、选路、选道作用,其在地图中的编码与嵌入方式是发挥效力的重点 [10] - 纯模仿学习存在局限,需结合强化学习以处理人类驾驶风格差异和罕见场景,使系统学习因果关系并实现泛化 [11] - 量产落地需规划兜底方案,通过时空联合规划等后处理逻辑对模型输出轨迹进行平滑优化,以保证稳定可靠 [13] 量产实践与课程内容映射 - 面向量产的端到端实战涉及多个核心算法,包括:一段式/两段式端到端、导航信息量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等 [2] - 量产经验分享涵盖数据、模型、场景、规则等多视角,旨在提供解决实际问题的工具与策略,以快速提升系统能力边界 [14] - 相关实战课程设计为期三个月,从任务概述、算法框架、RL算法、轨迹优化到兜底方案与经验分享,层层展开 [2][7][8][9][10][11][12][13][14]
端到端岗位求职:核心算法&实战讲解(7个project)
自动驾驶之心· 2025-12-08 08:02
行业招聘与技能需求变化 - 自动驾驶行业招聘需求正发生变化,两年前热门的感知岗位需求进一步收缩 [2] - 当前行业需求较高的方向集中在端到端、VLA(视觉语言动作模型)、世界模型等领域 [2] - 头部玩家已验证端到端技术路径可行,其他车企正跟进投入模型、场景、数据优化及规划兜底等方面的人力和资源 [2] - 市场面临人才技能与岗位需求不匹配的挑战,相关岗位技术栈广泛,但候选人往往只精通部分领域 [2] - 具体的量产经验,如导航信息引入、强化学习调优、轨迹建模与优化等,是实际落地中的关键痛点 [2] 课程核心内容与结构 - 课程名称为《面向量产的端到端实战小班课》,核心重点是聚焦量产应用 [2] - 课程设计历时三个月,内容从实战到落地层层展开 [2] - 课程涵盖核心算法包括:一段式端到端、两段式端到端、导航信息的量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等 [2] - 课程最终会分享实际的量产经验 [2] - 课程采用小班教学模式,仅剩20个招生名额 [2][4] - 课程面向进阶学员,建议具备自动驾驶BEV感知、视觉Transformer、端到端算法、强化学习、扩散模型理论基础,以及Python、PyTorch、mmdet3d框架等技能基础 [16] - 课程为离线视频教学,辅以VIP群答疑和三次线上答疑,开课时间为11月30日,预计三个月结课 [15][17] 技术发展趋势与课程章节详解 - **端到端任务概述**:在端到端时代,感知任务合并与规控算法学习化已成为绝对主流,如何高效合并感知任务及设计学习化规控模块是行业核心技能 [7] - **两段式端到端算法**:章节介绍两段式框架的建模方式、感知与规划控制的信息传递,分析其优缺点,并通过PLUTO算法进行实战讲解 [8] - **一段式端到端算法**:一段式框架可实现信息无损传递,性能上优于两段式方案,章节将学习基于VLA、扩散模型等多种方案,并以VAD系列进行深入教学 [9] - **导航信息的量产应用**:导航信息在自动驾驶中起引导、选路、选道作用,章节介绍主流导航地图格式、内容及其在端到端模型中的编码与嵌入方式 [10] - **自动驾驶中的强化学习算法**:纯模仿学习存在局限,需结合强化学习以学习因果关系并实现泛化,章节重点介绍强化学习算法及其训练策略 [11] - **端到端轨迹输出优化**:章节进行NN Planner项目实战,涵盖基于模仿学习的扩散模型与自回归算法,以及在监督微调后结合强化学习的实战 [12] - **兜底方案-时空联合规划**:为应对模型输出非100%准确,量产需轨迹平滑优化等后处理兜底逻辑,章节介绍多模态轨迹打分搜索及轨迹平滑算法 [13] - **端到端量产经验分享**:最终章节从数据、模型、场景、规则等多视角分享量产经验,剖析如何选用合适工具与策略以提升系统能力边界 [14] 讲师背景 - 讲师王路拥有C9本科和QS50高校博士学位,已发表若干CCF-A和CCF-B论文 [4] - 现任国内顶级Tier1供应商算法专家,从事大模型、世界模型等前沿算法的预研与量产工作 [4] - 所研发算法已成功落地并量产,拥有丰富的端到端算法研发和实战经验 [4]
汽车智能化系列专题之决策篇(7):各厂商技术持续突破,robotaxi商业化进展迎拐点
国信证券· 2025-12-03 19:58
行业投资评级 - 行业投资评级:优于大市(维持评级)[1] 核心观点 - 国内外政策逐步落地,智能驾驶高速发展是必然趋势[2] - 特斯拉与华为“端到端”算法引领技术突破,华为城市NOA覆盖率已达99.56%[2] - 比亚迪推动“智驾平权”,2025年高速NOA渗透率有望从11.3%增至39.0%,城市NOA渗透率从6.1%增至9.6%[2][41] - 伴随硬件成本下降和国产芯片崛起,智驾功能加速向10-20万元车型市场下沉[2][45] - Robotaxi全球市场潜力近10万亿元,Waymo与Apollo为领域领航者,商业化进程持续加速[2][115] 智驾规范:各方政策逐步落地 - 国家政策积极推动L3商用部署和L4技术探索,构建标准体系并鼓励示范应用[6][7] - 地方政府如北京、上海、广州、深圳积极探索应用场景,聚焦权责划分并进入试点阶段[6][7] - 海外政策不断完善高级别智驾安全条例,并以美国、日本为代表积极提升渗透率,拓宽使用场景[9][11] 高端智驾:特斯拉与华为端到端技术 - 特斯拉FSD V13采用火箭同源代码,实现从停车场直接启动的全程自动驾驶[16][17] - 特斯拉FSD V12采用端到端神经网络模型,优化30万行代码,实现数据收集到反应的自动化[16][17] - 华为ADS 3.0实现业界首发“车位到车位”智驾领航NCA功能,城市NCA覆盖率高达99.56%[19][20] - 华为ADS 3.0采用GOD大网与PDP网络结合的端到端算法,复杂路口通过率超过96%[19][20] 智驾平权:2025年智驾渗透率拐点 - 比亚迪智驾研发采取自研+合作模式,高阶系统“天神之眼”实现全国无图城市领航功能开通[24] - 比亚迪将中阶智驾市场下沉至10万元级车型,部分车型智驾版价格下探至7.98万元[26][29] - DeepSeek大模型接入降低车端算力需求和芯片部署成本,推进中阶智驾功能下放[30][32] - 国内各类车企积极布局L3产品,比亚迪智驾版预计2025年覆盖全系车型[34][35] - 比亚迪智能驾驶硬件配置呈现高低分层趋势,高端车型具备L3级能力[37][38] 产业链及零部件厂商分析 - 智驾芯片市场向SoC过渡,英伟达Orin-X算力达254 TOPS,Thor-X算力达1000 TOPS[50][51] - 英伟达以42%份额主导国内市场,地平线、华为为国产龙头,份额分别为10%和9%[53][56] - 比亚迪“天神之眼”计划拉动芯片市场需求,预计2025年市场规模达15.8亿美元,较2024年增长37%[59][63] - 激光雷达市场100%由本土厂商构成,2024年装机量超150万颗,速腾聚创与华为技术份额领先[69][72] - 预计2025年激光雷达市场规模达8亿美元,较2024年增长62%,禾赛科技市占率预期达31%[76][77] - 毫米波雷达市场规模预计2025年超10000万颗,本土企业立讯精密、德赛西威份额提升[84][95] - 车载摄像头市场年均复合增长率达21.31%,2025年前装市场规模预计达1.2亿颗[97][98] - 韦尔股份与舜宇光学约30%-40%利润来自ADAS业务,受益于功能下沉至10万元以下车型[103] Robotaxi:智能驾驶最佳商业化场景 - Robotaxi是基于L4/L5技术的出行服务,集成传感器、AI算法等实现完全自主驾驶[112][114] - 全球市场潜力广阔,乐观预计2030年市场规模可达9.06万亿元[115] - 中国和美国处于商业化第一梯队,Waymo与Apollo为领域领航者[116][121] - Pony AI已实现全市范围运营成本盈亏,目标2025年车队超1000辆;WeRide目标2030年部署十万辆[2]
最近,自动驾驶的岗位招聘有一些新的变化......
自动驾驶之心· 2025-12-03 08:04
自动驾驶行业招聘趋势变化 - 感知岗位需求进一步收缩,而端到端、VLA、世界模型等方向需求较高 [1] - 头部玩家已验证端到端路径可行,其他车企正跟进模型优化、场景优化、数据优化及规划兜底等资源投入 [1] - 候选人技术栈狭窄,缺乏导航信息引入、强化学习调优、轨迹建模等量产经验,成为实际落地痛点 [1] 端到端量产课程核心内容 - 课程聚焦量产实战,涵盖一段式端到端、两段式端到端、导航信息应用、强化学习、扩散模型+强化学习等核心算法 [1][2] - 课程设计基于实际量产需求,包括轨迹优化、兜底方案及量产经验分享,仅限25名学员参与 [2][3] - 讲师为顶级Tier1算法专家,具备大模型、世界模型等前沿算法预研和量产落地经验 [3] 课程大纲与技术模块 - 第一章介绍感知任务合并与规控学习化趋势,分析主流一体化架构及开源数据集评测方式 [6] - 第二、三章对比两段式与一段式端到端框架,分别讲解PLUTO算法实战和VAD系列方法,强调一段式方案性能更优 [7][8] - 第四至七章深入导航信息编码、强化学习泛化训练、轨迹输出优化及时空联合规划兜底方案,覆盖模仿学习与强化学习结合应用 [9][10][11][12] - 第八章从数据、模型、场景等多视角分享量产经验,提升系统能力边界 [13] 课程安排与学员基础要求 - 课程周期为三个月,自11月30日起分章节解锁教学,包含离线视频与三次线上答疑 [14][16] - 学员需自备GPU(推荐算力4090及以上),熟悉BEV感知、Transformer、强化学习等算法,具备Python/PyTorch及数学基础 [15]
即将开课!面向量产的端到端小班课,上岸高阶算法岗位~
自动驾驶之心· 2025-11-27 08:04
课程核心定位 - 课程聚焦于自动驾驶领域端到端技术的量产化实战应用,旨在解决行业量产人才稀缺的问题 [1] - 课程设计历时三个月,内容涵盖从模型优化、场景优化、数据优化到下游规划兜底的全栈技能 [1] - 课程由自动驾驶之心联合工业界算法专家开设,重点为面向就业直击落地,目前仅剩35个招生名额 [3][5] 核心算法与技术内容 - 课程涉及的核心算法包括一段式端到端、两段式端到端、导航信息的量产应用、开闭环强化学习等 [3] - 技术组合涵盖扩散模型+强化学习、自回归+强化学习、时空联合规划等前沿方法 [3] - 课程最后将分享实际的量产经验,帮助学员构建完整的量产优化知识体系 [3] 讲师背景 - 讲师王路拥有C9本科和QS50 PhD学历,已发表多篇CCF-A和CCF-B论文 [6] - 现任国内顶级tier1公司算法专家,从事大模型、世界模型等前沿算法的预研和量产工作 [6] - 所研发算法已成功落地并量产,拥有丰富的端到端算法研发和实战经验 [6] 课程大纲详解 - 第一章介绍主流感知模型一体化架构和经典规控learning化方案,以及开源数据集和评测方式 [9] - 第二章讲解两段式端到端算法框架,包括建模方式、感知与PNC信息传递,并通过PLUTO算法实战 [10] - 第三章深入一段式端到端框架,涵盖基于VLA和diffusion的方法,重点学习VAD系列 [11] - 第四章专注导航信息的量产应用,包括导航地图格式、编码嵌入方式及能力发挥 [12] - 第五章从模仿学习过渡到强化学习,重点介绍RL算法及其训练策略以解决corner-case场景 [13] - 第六章进行nn planner项目实战,结合模仿学习与强化学习,重点讲解扩散模型和自回归算法 [14] - 第七章介绍时空联合规划等轨迹平滑优化算法,作为模型直出的兜底方案确保轨迹稳定可靠 [15] - 第八章从数据、模型、场景、规则多视角分享量产经验,提升系统能力边界 [16] 课程安排与学员要求 - 课程于11月30日开课,预计三个月结课,采用离线视频教学加VIP群答疑模式 [17] - 学员需自备GPU,推荐算力在4090及以上,并具备BEV感知、视觉Transformer等算法基础 [18] - 要求掌握强化学习、扩散模型理论基础,熟悉Python、PyTorch及mmdet3d算法框架 [18] - 需要一定的高等数学、线性代数和矩阵论基础,课程按周解锁章节,持续至次年2月底 [19]
工业界算法专家带队!面向落地的端到端自动驾驶小班课
自动驾驶之心· 2025-11-21 08:04
端到端自动驾驶技术行业需求与挑战 - 端到端技术已成为车企量产核心招聘岗位 但市场上面向量产的真正人才极为稀缺[1] - 端到端岗位要求全栈能力 涵盖模型优化 场景优化 数据优化以及下游规划兜底等多个环节[1] - 行业当前需攻克导航信息引入 强化学习调优 轨迹建模与优化等量产一线难题[3] 端到端量产课程核心内容 - 课程设计历时三个月 聚焦从实战到落地的进阶内容[3] - 核心算法覆盖一段式端到端 两段式端到端 导航信息量产应用 开闭环强化学习 扩散模型+强化学习 自回归+强化学习 时空联合规划等[5] - 课程重点在于面向就业与直击落地 仅开放35个招生名额[5] 课程详细大纲 - 第一章:介绍感知模型一体化架构与规控学习化方案 分析任务合并与模块设计[10] - 第二章:讲解两段式框架建模 感知与PNC信息传递 优缺点 并以PLUTO算法实战[11] - 第三章:分析一段式框架优势 学习VLA VAD等基于diffusion的方法 实现信息无损传递[12] - 第四章:解析导航地图格式 内容 及其在端到端模型中的编码与嵌入方式[13] - 第五章:从模仿学习过渡到强化学习 讲解RL算法及训练策略以解决场景泛化问题[14] - 第六章:进行nn planner项目实战 结合模仿学习与强化学习 涵盖扩散模型与自回归算法[15] - 第七章:介绍时空联合规划等轨迹平滑优化算法 作为模型输出不准时的兜底方案[16] - 第八章:分享数据 模型 场景 规则等多视角的量产经验 提升系统能力边界[17] 课程师资与安排 - 讲师王路拥有C9本科及QS50 PhD背景 发表多篇CCF-A/B论文 现任国内顶级Tier1算法专家 具备大模型 世界模型等前沿算法预研与量产经验[6] - 课程面向具备BEV感知 视觉Transformer 强化学习 扩散模型 Python/PyTorch等基础的进阶学员 需自备4090及以上算力GPU[18][19] - 课程采用离线视频教学 辅以VIP群答疑及三次线上答疑 自11月30日开课 预计三个月结课 按周解锁各章节内容[20]
智驾软硬件持续迭代,robotaxi未来已来
2025-11-03 10:35
行业与公司概览 * 纪要涉及的行业为智能驾驶(智驾)行业,包括高级辅助驾驶(L2/L2+)和全自动驾驶(L4/Robotaxi)领域 [1] * 纪要重点讨论的第三方智驾软件供应商包括Momenta、华为、大疆(卓翼)、地平线、元戎启行 [3] 市场格局与公司能力 * Momenta在第三方智驾市场占据领先地位,份额达55%,华为占25% [1][3] * Momenta提供单Orin X和双Orin X两种方案,覆盖从比亚迪、智己到奇瑞等不同车型,展现其工程化和算法裁剪能力 [1][3] * 华为凭借强大的体验和工程化能力,支持多款车型、自研芯片及大规模路侧泛化,但其顶尖算力芯片目前主要用于ADS 4.0 Ultra版本 [3] * 大疆在低算力芯片(如TI TDA4)解决方案上工程化能力出众,但市场对低算力芯片(32 TOPS或100 TOPS以下)的需求正在转向中高算力方案 [1][4] * 地平线采用自研软硬一体化方案(如HSD及G6P系列),已在奇瑞星途车型上量产,但受限于NPU算力及迭代升级,整体效果仍需提升,需更多车型验证工程化能力 [1][6] * 元戎启行主要集中在城市NOA,基于英伟达平台开发并与长城汽车合作紧密,其算法开发能力领先但工程化能力相对较弱 [7] 技术路线与核心观点 * 当前智驾行业技术路线主要分为三类:端到端算法(代表企业有Momenta、特斯拉、极氪)、VLA模型(代表企业有理想、小鹏)以及世界模型(华为、Momenta、地平线等正在开发) [2] * 车企智驾能力差异主要由算法、数据和算力三大因素决定,短期内算法调整效果明显,长期来看数据积累是关键,高效训练依赖强大计算资源 [8][9] * 长期看,若厂商继续沿用当前技术路线(如Transformer),智驾能力差异将逐渐收敛,数据积累达到一定规模(如特斯拉的50亿英里)后会出现数据饱和效应 [10] * 在感知硬件路线上,融合感知路线(结合激光雷达)比纯视觉更具长期优势,原因包括激光雷达成本已降至200多美元、数据处理技术提升能应对复杂场景、新法规对障碍物检测提出更高要求 [12] * L2+公司向L4发展更具优势,过渡自然且资源投入较少,但挑战在于全域泛化能力和量产一致性 [1][20] 芯片架构与发展需求 * 下一代智能驾驶芯片需求包括:强大的GPU/NPU以支持VLA和世界模型等高级功能、高带宽(未来可能需要从当前290GB/s翻倍或增至1.5倍)、工艺与功耗平衡(如3纳米或5纳米)、增加内存容量 [14][15] * 不同级别自动驾驶的算力需求:L2级需5-10 TOPS,增加泊车功能需约16 TOPS;L2++(高速辅助驾驶)需30-100 TOPS;L3级需500 TOPS以上;L4级普遍认为需1,000 TOPS以上 [16] * 对于L3及以上级别,冗余设计变得重要,例如采用双Orin芯片配置以备未来升级 [16] * 智能驾驶芯片与机器人芯片平台差异不大,许多厂商借鉴共用平台以降低成本 [17] Robotaxi商业化前景 * Robotaxi市场是一个正能性市场,不完全依赖技术驱动,关键在于提高场景内车辆通行效率和减少远程接管及事故率 [18] * 实现盈亏平衡需区域扩展足够大且定价合理,主要成本来自车辆折旧(如小马智行第六代车成本高达60万人民币),可通过定制化、换电等方式降本,同时需确保价格竞争力和扩大行驶里程覆盖范围以提高收入 [19] 其他重要细节 * VLA技术对智能驾驶体验的提升主要集中在功能创新(如自动前进/后退)和对带有语义信息的环境理解能力上,提高了决策合理性和流畅性 [11] * 大多数第三方算法公司(如Momenta、元戎启行)更倾向于开发通用算法并进行跨平台适配,而非与特定芯片厂商深度绑定,软硬件耦合较深的主要是同时提供软硬件解决方案的公司(如华为、地平线) [13]
开学了,需要一个报团取暖的自驾学习社区...
自动驾驶之心· 2025-09-05 07:33
自动驾驶行业招聘与求职 - 金九银十为秋招关键期 业内tier 1公司已开始发放测试岗位offer 但部分求职者仍希望冲刺算法岗[1] - 行业招聘需求集中在感知算法、端到端自动驾驶、4D标注、多模态大模型等前沿方向[7][11][14] - 主流车企与科技公司包括理想、地平线、百度、上海人工智能实验室、蔚来、小鹏、华为车BU、大疆等均开放岗位[38] - 课程学员可获得直接推荐至算法开发负责人的机会 绕过官网投递流程[38] 自动驾驶技术发展趋势 - 端到端自动驾驶成为智驾量产核心算法 分为一段式与二段式技术方向 理想汽车已宣布E2E+VLM双系统架构量产[7] - 2024年端到端技术需融合多模态大模型、BEV感知、强化学习、视觉Transformer、扩散模型等多领域知识[8] - 4D自动标注算法需求激增 因端到端训练需时间同步后的传感器统一标注动静态元素、OCC和轨迹等[11] - 多模态大模型与自动驾驶结合成为新兴领域 学术界论文爆发 工业界融资案例快速增长[14] 专业培训课程体系 - 推出299元超级折扣卡 一年期内享受全平台课程七折优惠[4][6] - 开设端到端与VLA自动驾驶小班课 涵盖多模态大模型、BEV感知、强化学习等核心技术[7][8] - 4D自动标注算法就业小班课聚焦数据闭环算法开发与工程化落地[11][12] - 多模态大模型实战课程系统化覆盖从通用模型到端到端自动驾驶应用[14][15] - 感知系列课程包括BEV感知全栈、毫米波雷达视觉融合、激光雷达视觉融合等16个模块[16] - 规划控制与预测课程包含轨迹预测理论与实战、规划控制小班课等[18] - 模型部署课程涵盖CUDA与TensorRT部署、BEV模型部署实战[18] 硬件与科研平台 - 全栈教研平台黑武士001支持全流程开发[4][43] - 足式/强化学习科研平台TRON1针对进阶研究[4][43] - 四足机械狗+机械臂科研平台整合运动控制与操作[4][43] - 桌面级机械臂科研平台适用于轻量级实验[4][43] - 数采夹爪提供单臂与双臂方案 支持数据采集任务[4][43] 学习与交流机制 - 每门课程配备专属VIP交流群 主讲老师每日群内交流并定期直播答疑[26] - 重点解决小白常踩坑问题、工程常见问题及后续研究方向[26] - 实际讨论内容涵盖模型微调(如Florence2)、TensorRT部署、多模态数据标注等实操问题[28][29][32] 工程实践与挑战 - 车端部署需满足低于100毫秒响应时间的理想目标 复杂场景要求成功率99.9%以上[34] - 转向角误差需小于1度(理想目标)或2度(可接受范围)[34] - 加速制动误差需小于0.1 m/s²(理想目标)或0.2 m/s²(可接受范围)[34] - 传感器升级(如相机200万→800万像素)可能需重构数据集与模型重新训练[36] - 多传感器联合标定采用在线标定与优化结合方式 依赖高精地图投影验证精度[36]