端到端自动驾驶 - 财报，业绩电话会，研报，新闻 - Reportify

端到端自动驾驶

搜索文档

从端到端到VLA，自动驾驶量产开始往这个方向发展...

自动驾驶之心· 2025-07-26 21:30

端到端自动驾驶行业现状 - 端到端自动驾驶已成为国内主流新能源主机厂抢占的技术高地，E2E+VLM双系统架构去年取得成功后，VLA概念在2024年上半年掀起新一轮量产方案迭代[2] - 行业对端到端技术人才需求旺盛，3-5年经验的VLM/VLA岗位年薪高达百万，月薪达70K[2] - 学术界和工业界聚焦端到端技术，但存在技术流派分化问题，包括UniAD、PLUTO、OccWorld、DiffusionDrive等多种算法方案[2][7] 端到端技术发展特点 - 技术演进快速，2023年的工业级端到端算法方案已不适应2024年环境，需掌握多模态大模型、BEV感知、强化学习等跨领域知识[3] - 技术栈呈现多元化发展，包括基于感知的一段式（UniAD）、基于世界模型的一段式（OccWorld）、基于扩散模型的一段式（DiffusionDrive）以及VLA方向[7][11] - 学习门槛较高，存在论文数量繁多（年新增数百篇）、知识碎片化、缺乏高质量文档等挑战[3] 端到端课程核心内容 - 课程覆盖五大技术模块：端到端算法介绍、背景知识、二段式端到端、一段式端到端与VLA、RLHF微调实战[9][10][11][13] - 重点技术包括：PLUTO二段式架构（CVPR'25 CarPlanner）、UniAD感知方案（CVPR'24 PARA-Drive）、世界模型（AAAI'25 Drive-OccWorld）、扩散模型（DiffE2E）、VLA（小米ORION）[7][10][11] - 实战环节包含Diffusion Planner代码复现和ORION开源模块应用，目标实现工业级算法落地[11][13] 行业技术趋势 - VLA成为端到端自动驾驶的"皇冠技术"，小米ORION、慕尼黑工大OpenDriveVLA等方案显示大模型与自动驾驶的深度结合[11] - 扩散模型在轨迹预测领域取得突破，DiffusionDrive等方案实现多模轨迹输出，适应自动驾驶不确定性环境[7][11] - 世界模型技术应用扩展，Drive-OccWorld等方案同时支持场景生成、端到端控制和闭环仿真[11] 人才能力要求 - 需构建跨领域知识体系，包括视觉Transformer（CLIP/LLaVA）、BEV感知（3D检测/车道线/OCC）、扩散模型理论、VLM强化学习（RLHF/GRPO）[12] - 工程能力要求涵盖PyTorch框架、GPU计算（推荐RTX4090）、数学基础（概率论/线性代数）及算法复现能力[20] - 职业发展目标为1年经验端到端算法工程师水平，具备技术框架设计能力和项目落地经验[20]

端到端自动驾驶

端到端与VLA自动驾驶小班课

端到端自动驾驶

端到端与VLA自动驾驶小班课

端到端自动驾驶万字长文总结

自动驾驶之心· 2025-07-23 17:56

端到端自动驾驶算法研究背景 - 传统自动驾驶算法采用模块化流程：感知→预测→规划，每个模块输入输出不同，存在误差累积问题且感知信息存在损失[3][5] - 端到端算法直接输入原始传感器数据并输出路径点，避免了模块间误差传递，但面临可解释性差和优化困难等挑战[3][7] - 传统算法优势在于调试便捷和可解释性，而端到端方法在信息完整性方面表现更优[3] 端到端算法技术范式与挑战 - 当前主流采用模仿学习框架，包括行为克隆和逆优化控制两种方法，但难以处理corner case且真值数据存在噪声[7][8] - 评估方法分为开环（固定场景）和闭环（动态交互）两种，因果混淆现象是典型挑战[8] - 技术难点还包括输入模态多样性、多任务学习、知识蒸馏及安全保证等问题[8] ST-P3算法实现细节 - 采用时空学习框架，明确设计感知/预测/规划三模块，创新点包括自车中心累积对齐和双路预测机制[10][11] - 感知模块通过LSS范式生成BEV空间表征，考虑RO/PG角不为零的情况并进行时序融合[13] - 规划阶段引入红绿灯编码优化轨迹，代价函数综合距离/加速度/终点偏差等指标[14][15][16] UniAD系统架构 - 全Transformer框架以规划为导向，包含MapFormer/MotionFormer/OccFormer/Planner等模块[23] - 创新性引入五个代理任务提升性能，通过TrackFormer实现动态Agent跟踪[25][26] - 规划模块整合转向灯信号和自车特征，基于碰撞优化输出最终轨迹[31] 矢量化方法VAD - 将栅格表征转为矢量形式保持几何特性，计算速度优势明显[32] - 通过Map Query/Agent Query分别预测地图矢量和运动矢量，与自车状态交互完成规划[33] - 引入三类约束条件：碰撞约束/边界距离约束/方向约束，通过成本抑制机制优化[38][39][40] 概率化表征方法 - 采用概率分布替代确定性轨迹，解决多模态场景下的折中轨迹问题[42] - 离散化动作空间为4096种规划token，通过场景交互选择最优概率轨迹[43] - GenAD工作采用VAE式生成建模，训练时学习轨迹分布，推理时采样生成[44][46] 多模态规划进展 - 英伟达研究结合多模态规划与多模型学习，增加基于规则的教师模型蒸馏损失[49][52] - 监督信号涵盖无责任碰撞/可行驶区域合规/驾驶舒适性等指标[52] - 当前技术仍受限于数据驱动特性，对异常案例处理能力有待提升[53]

端到端自动驾驶

多模态规划

Autonomous Driving

端到端自动驾驶

多模态规划

Autonomous Driving

同济大学最新！GEMINUS：端到端MoE实现闭环新SOTA，性能大涨近8%~

自动驾驶之心· 2025-07-22 20:46

核心观点 - GEMINUS是一种基于专家混合（MoE）的端到端自动驾驶框架，通过双感知路由器动态激活全局专家和场景自适应专家，在多样化场景下实现自适应与鲁棒性兼具的性能 [1] - 该框架在Bench2Drive闭环基准测试中超越现有方法，驾驶评分提升7.67%，成功率提升22.06%，MultiAbility-Mean提升19.41% [2][49] - 仅使用单目视觉输入即达到SOTA水平，驾驶评分提升9.17%，成功率提升25.77%，开环平均L2误差降低5.88% [37] 技术架构框架设计 - 包含全局专家（整体数据集训练）、场景自适应专家组（场景子集训练）和双感知路由器（场景级特征+路由不确定性） [1] - 路由器采用硬分配机制，当不确定性低于阈值时选择场景专家，高于阈值时启用全局专家 [18] - 场景分类包括汇入、超车、紧急制动、让行和交通标志5类 [24] 关键组件 - 特征编码器采用ResNet34处理图像输入，测量编码器处理车辆状态信息 [20] - 轨迹规划器生成未来航路点序列，通过PID控制器输出控制信号 [17][20] - 损失函数整合轨迹模仿、特征对齐、价值对齐等多目标优化 [29][31][33] 性能表现基准测试 - 驾驶评分65.39，成功率37.73%，MultiAbility-Mean 37.77%，均显著优于单专家基线 [41] - 超车场景准确率91.35%，交通标志场景90.45%，但让行场景仅2.87% [42][46] - 全局专家利用率6.29%，在模糊场景中发挥稳定作用 [47][48] 消融实验 - 纯MoE架构直接应用会导致性能下降，验证定制化设计的必要性 [40] - 场景感知路由使驾驶评分提升2.72%，成功率提升4.40% [40] - 不确定性路由+全局专家带来额外4.83%驾驶评分和22.06%成功率提升 [40] 行业应用技术突破 - 首次将MoE架构成功应用于端到端自动驾驶，解决模态平均问题 [6][12] - 单目视觉性能超越多相机方案，降低硬件成本 [37][38] - 路由机制可解释性强，专家利用率反映场景特征明显程度 [47] 发展前景 - 可扩展至多相机输入提升场景感知能力 [50] - 探索Mixture-of-LoRA架构优化参数效率 [50] - 在长尾场景处理和安全冗余方面具备迭代潜力 [11][50]

端到端自动驾驶

专家混合模型

端到端自动驾驶

专家混合模型

可以留意一下10位业内人士如何看VLA

理想TOP2· 2025-07-21 22:36

自动驾驶技术发展现状 - BEV感知方案已完全成熟并广泛应用于量产车型基于BEV的动态感知、静态感知、OCC感知均实现技术落地 [16][24] - 端到端方案仍处于验证阶段实际效果未显著超越传统两阶段模型存在数据收集难度大、训练成本高等实操问题 [11][31] - 行业面临的核心挑战是corner case处理能力非结构化道路、复杂路口等场景通过率不足99% [16][24] 新兴技术路线争议 VLA/VLM技术 - **看好派**：认为VLA通过大模型推理能力实现场景理解可突破传统规则引擎的迭代瓶颈是下一代技术重点方向 [2][28] - **质疑派**：指出当前VLA基座多依赖开源模型魔改缺乏专用预训练体系且车端算力限制导致性能与延迟难以平衡 [1][27] - **中立派**：认为对话功能仅提供情绪价值控车逻辑需独立设计量产可行性存在但效果待验证 [3][18] 关键技术突破方向 - **世界模型**：三大应用场景包括预训练、仿真数据生成、端侧推理目前数据生成领域已取得阶段性成果 [6][33] - **强化学习**：仿真精度是核心瓶颈若能解决sim2real域差距配合端到端架构将实现性能飞跃 [6][32] - **扩散模型**：适配多模态轨迹生成特性地平线DiffusionDrive方案已实现实时性突破 [7][26] 行业竞争格局演变 - 数据闭环能力成为竞争焦点头部公司重点构建AI驱动的数据流水线涵盖采集、清洗、标注全流程自动化 [20][22] - 仿真技术呈现两极分化：L4企业侧重世界模型构建安全验证体系 L2+厂商聚焦VLA提升泛化能力 [18][30] - 芯片算力制约技术落地 7B参数以下模型成主流量化加速与轻量化算法需求迫切 [27][28] 学术与产业协同 - 学术界研究滞后于产业落地 BEV从论文发表到量产应用耗时2年当前VLA等技术尚未形成理论共识 [31][9] - 产学研割裂问题突出工业界数据壁垒导致学术界缺乏真实场景验证数据集 [13][31] - 3D高斯等新型表征方法有望重构世界模型架构球谐函数替换等基础研究具备潜力 [6][33] 技术路线选择建议 - 短期优先完善一站式端到端方案长期需突破鲁棒性瓶颈以实现L4 [18][26] - 平价车型可采用BEV+蒸馏方案过渡等待芯片成本下降支撑大模型部署 [24][26] - 自动驾驶与具身智能技术互通建议选择迁移性强的研究方向 [34][22]

端到端自动驾驶

端到端自动驾驶

70K？端到端VLA现在这么吃香！？

自动驾驶之心· 2025-07-21 19:18

端到端自动驾驶技术发展 - 端到端自动驾驶已成为国内主流新能源主机厂抢占的技术高地上半年VLA概念掀起新一轮量产方案迭代 [2] - 行业薪资水平显示：3-5年经验的VLM/VLA算法专家年薪达百万月薪高达70K [2] - 技术流派分化明显：二段式端到端以PLUTO为代表一段式分为感知型(UniAD)、世界模型型(OccWorld)、扩散模型型(DiffusionDrive)等四大方向 [4] 技术流派与前沿进展 - 二段式端到端聚焦模型自车规划包含港科技PLUTO、浙大CarPlanner(CVPR'25)、中科院Plan-R1等代表性工作 [7][22] - 一段式端到端四大子领域： - 感知型：UniAD为奠基作地平线VAD和CVPR'24的PARA-Drive为最新进展 [23] - 世界模型型：AAAI'25的Drive-OccWorld和复旦OccLLaMA实现场景生成/端到端/闭环仿真多应用 [23] - 扩散模型型：DiffusionDrive开创多模轨迹时代吉大DiffE2E为最新成果 [23] - VLA型：小米ORION、慕尼黑工大OpenDriveVLA和ReCogDrive代表大模型时代技术方向 [23] 行业人才需求 - VLA/VLM算法专家岗位需求旺盛： - 3-5年经验硕士薪资40-70K·15薪 [10] - 多模态方向博士应届生可达90-120K·16薪 [10] - 模型量化部署工程师1-3年经验薪资40-60K·15薪 [10] - 技术能力要求涵盖大语言模型 BEV感知扩散模型强化学习与RLHF等跨领域知识 [7][15] 技术培训体系 - 课程体系覆盖五大模块： - 端到端发展历史与VLA范式演变 [21] - 核心技术栈包括Transformer/CLIP/LLAVA/BEV感知/扩散模型理论 [24] - 二段式与一段式技术对比及工业落地 [22][23] - RLHF微调实战与大模型强化学习应用 [25] - 教学采用Just-in-Time Learning理念三个月完成从理论到实践的闭环训练 [16][17][18][30] 技术门槛与挑战 - 学习路径需同时掌握多模态大模型 BEV感知视觉Transformer 扩散模型等六大技术领域 [15] - 论文数量繁多且知识碎片化高质量文档稀缺导致入门难度高 [15] - 硬件要求需配备4090及以上算力GPU 需具备Transformer和PyTorch基础 [32]

端到端自动驾驶

端到端自动驾驶算法

《端到端与VLA自动驾驶小班课》

端到端自动驾驶

端到端自动驾驶算法

《端到端与VLA自动驾驶小班课》

还不知道研究方向？别人已经在卷VLA了......

自动驾驶之心· 2025-07-21 13:18

自动驾驶技术演进 - 传统模块化架构存在错误累积效应和信息损失问题，依赖人工规则难以应对复杂场景 [2] - 纯视觉端到端模型简化架构但存在黑箱问题和泛化能力限制，如NVIDIA DAVE-2和Wayve的模仿学习方案 [2] - VLA范式通过语言桥梁结合视觉与行为，提升可解释性并注入LLM的世界知识，解决长尾场景处理难题 [2][3] VLA模型核心优势 - 实现自然语言决策解释（如减速原因分析），增强系统透明度 [2] - 利用LLM预训练的常识理解复杂场景（如施工区域需慢行） [3] - 支持自然语言交互（如"找充电站"指令），推动人性化驾驶体验 [3] 科研辅导课程设计 - 12周在线科研+2周论文指导+10周维护期，覆盖经典与前沿论文分析及代码实践 [6] - 提供baseline代码（如DiffusionDrive、OpenDriveVLA等）和公开数据集（nuScenes、Waymo） [15][17] - 采用"2+1"多师制团队，主导师为名校教授，副导师为博士/硕士，配备督学班主任 [14] 学员能力培养目标 - 掌握VLA算法理论与创新思路，完成论文初稿 [12] - 获得选题方法、实验设计及投稿建议，强化PyTorch和Python实战能力 [7][13] - 基础要求包括深度学习基础、自动驾驶算法了解及8张4090显卡硬件配置 [13] 关键学术资源 - 必读论文包括Senna、OpenDriveVLA等5篇顶会论文，聚焦VLA与自动驾驶结合 [18] - 课程产出含结业证书、推荐信及论文初稿，助力留学申请与职业发展 [14]

视觉 - 语言 - 行为（VLA）

端到端自动驾驶

大型语言模型（LLM）

大型多模态模型（LMM）

视觉 - 语言 - 行为（VLA）

端到端自动驾驶

大型语言模型（LLM）

大型多模态模型（LMM）

面试了很多端到端候选人，还是有很多人搞不清楚。。。

自动驾驶之心· 2025-07-20 16:36

端到端自动驾驶技术概述 - 端到端自动驾驶分为一段式端到端和二段式端到端两大技术方向是当前薪资最高的算法岗位之一 3-5年经验可冲击百万年薪 [2] - 核心优势在于直接从传感器输入到车辆规划/控制信息的直接建模避免了传统模块化方法的误差累积 BEV感知技术实现了模块间的统一视角 [2] - UniAD模型统一了感知和规划任务标志着端到端时代的来临但并非最终解决方案后续涌现出多种技术流派 [2][4] 主要技术流派 - **二段式端到端**：以PLUTO为代表专注于用模型实现自车规划 [4] - **一段式端到端**： - 基于感知的方法：以UniAD为代表持续发展 [4] - 基于世界模型的方法：以OccWorld为代表开创新流派 [4] - 基于扩散模型的方法：以DiffusionDrive为代表实现多模轨迹预测 [4] - **VLA方向**：大模型时代下的端到端新方向结合视觉语言模型技术 [4][22] 行业应用与人才需求 - VLA/VLM大模型算法专家岗位薪资达40-70K*15薪博士应届生可达90-120K*16薪 [9] - 技术岗位覆盖感知算法、模型量化部署等多方向实习岗位日薪220-400元 [9] - 主机厂已开展端到端算法预研和量产交付形成完整技术落地闭环 [25] 技术发展挑战 - 需同时掌握多模态大模型、BEV感知、强化学习、扩散模型等跨领域知识 [14] - 论文数量繁多且知识碎片化缺乏系统性学习框架和实战指导 [14] - 高质量文档稀缺提高了技术入门门槛 [14] 课程体系设计 - **知识框架**：覆盖BEV感知、扩散模型理论、强化学习与RLHF等核心技术栈 [6][23] - **案例研究**： - 二段式端到端解析PLUTO、CarPlanner等经典算法 [21] - 一段式端到端深入UniAD、OccLLaMA等前沿工作 [22] - **实战环节**： - 扩散模型轨迹预测实战Diffusion Planner [22] - VLA方向实战小米ORION开源框架 [22] - 大作业RLHF微调实现技术迁移应用 [24] 技术发展趋势 - 世界模型应用扩展至场景生成、闭环仿真等多场景成为近年研究热点 [22] - 扩散模型与VLM结合推动多模轨迹预测技术落地 [22] - VLA被视为端到端自动驾驶的"皇冠" 工业界招聘需求旺盛 [22]

端到端自动驾驶

大语言模型

端到端自动驾驶

大语言模型

港中文最新！ReAL-AD：迈向类人推理的端到端自动驾驶，轨迹性能提升30%（ICCV'25）

自动驾驶之心· 2025-07-20 16:36

核心观点 - 提出ReAL-AD框架，通过三层人类认知模型（驾驶策略、驾驶决策、驾驶操作）实现类人推理的端到端自动驾驶 [2][8] - 集成视觉-语言模型（VLMs）增强环境感知和结构化推理能力，规划准确性和安全性提升超过30% [2][11][34] - 采用层次化轨迹解码器实现从粗到细的轨迹规划，L2误差减少33%，碰撞率降低32% [9][34] 技术架构 - **策略推理注入器**：解析VLM生成的交通情境见解，制定高层次驾驶策略 [8][17] - **驾驶推理整合器**：将战略意图细化为可解释的驾驶选择（如变道、超车、速度调整） [8][20] - **层次化轨迹解码器**：两阶段变分解码器，先建立粗略运动模式再细化轨迹 [24][26] 实验验证 - **数据集**：NuScenes（1,000个20秒场景）和Bench2Drive（13,638片段/200万帧） [30] - **开环指标**：平均L2误差0.48米（NuScenes）、0.84米（Bench2Drive），碰撞率0.15%/0.12% [34] - **闭环指标**：驾驶评分提升至41.17，成功率11.36%，优于基线模型UniAD/VAD [35] 行业对比 - **传统方法局限**：依赖固定稀疏轨迹监督，无法模拟人类分层决策过程 [3][7] - **现有VLM应用**：多作为辅助模块提供语义线索，缺乏与决策层次的有机整合 [5][12] - **创新点**：首次将VLM推理嵌入三层决策架构，实现战略-战术-操作的全链路协同 [8][11] 性能优化 - **消融实验**：移除战略推理注入器导致L2误差增加12%，碰撞率上升19% [36] - **解码器设计**：两层结构比单层L2误差降低0.14米，三层会引入过拟合 [39] - **损失函数**：相似性损失有效弥合文本特征与轨迹预测特征的模态差距 [38]

端到端自动驾驶

推理增强学习框架

视觉 - 语言模型（VLMs）

端到端自动驾驶

推理增强学习框架

视觉 - 语言模型（VLMs）

死磕技术的自动驾驶黄埔军校，三周年了。。。

自动驾驶之心· 2025-07-19 11:04

自动驾驶技术发展现状 - 自动驾驶技术正处于从辅助驾驶（L2/L3）向高阶无人驾驶（L4/L5）跨越的关键阶段 [2] - 2025年自动驾驶、具身智能、大模型Agent三大赛道是AI竞争高地 [2] - 端到端自动驾驶成为主流学习方向，建议从BEV感知开始逐步深入 [2] 自动驾驶技术社区 - 自动驾驶之心知识星球是国内最大的自动驾驶学习社区，拥有近4000名成员 [2] - 社区汇聚100+行业专家，提供30+技术方向学习路线 [2] - 覆盖端到端自动驾驶、世界模型、视觉大语言模型等前沿方向 [2][4] 视觉大语言模型研究 - CVPR 2024发布多篇视觉语言模型预训练论文，涉及效率提升和公平性优化 [11] - 视觉语言模型评估涵盖图像分类、文本检索、行为识别等任务 [16][17][18] - 大规模预训练数据集包括LAION5B（50亿图文对）、WebLI（120亿图文对） [15] 自动驾驶数据集 - 主流自动驾驶数据集包括nuScenes、Waymo Open Dataset、BDD100K等 [21] - 语言增强数据集支持自然语言导航、视觉问答等任务 [22] - 图像分类评估数据集包含ImageNet-1k（128万训练图）、CIFAR-100等 [16] 技术应用领域 - 智能交通领域应用包括语言引导车辆检索、视觉问答系统 [23] - 自动驾驶感知方向研究语言引导3D检测、开放词汇分割等任务 [24] - 决策控制领域探索大语言模型在轨迹预测和运动规划中的应用 [25][26] 世界模型研究进展 - 2024年发布DriveWorld、GAIA-1等驾驶世界模型，支持场景生成与理解 [30][32] - 世界模型可预测未来视觉观测并辅助规划决策 [32] - 研究涵盖4D场景重建、占用预测等方向 [32] 扩散模型应用 - 扩散模型在自动驾驶中用于场景生成、数据增强和轨迹预测 [39] - CVPR 2024发布MagicDriveDiT等街景生成模型 [39] - 研究聚焦时空一致性、多视角生成等挑战 [39] 端到端自动驾驶 - 方法分为模仿学习、强化学习和多任务学习三大类 [61] - 最新工作如DriveGPT4、DriveMLM探索大模型与规划控制结合 [27][51] - 挑战包括长尾分布处理、安全验证等 [55][57] 行业资源与生态 - 社区提供TensorRT部署、BEV感知等工程问题解决方案 [71][73] - 与地平线、蔚来等公司建立内推渠道 [110] - 成员来自卡耐基梅隆、清华等高校及头部自动驾驶公司 [106][107]

视觉大语言模型

端到端自动驾驶

视觉大语言模型

端到端自动驾驶

端到端VLA这薪资，让我心动了。。。

自动驾驶之心· 2025-07-17 19:10

端到端自动驾驶技术发展 - 端到端自动驾驶分为一段式端到端和二段式端到端两大技术方向自UniAD获得CVPR Best Paper后国内智驾军备竞赛加速理想汽车2024年宣布E2E+VLM双系统架构量产 [2] - 端到端技术通过传感器数据直接输出规划或控制信息避免了模块化方法的误差累积 BEV感知和UniAD统一了感知与规划任务推动技术跃迁 [2] - 当前技术发展出多分支包括基于感知的UniAD 基于世界模型的OccWorld 基于扩散模型的DiffusionDrive 以及大模型驱动的VLA方向 [9] 技术挑战与行业需求 - 端到端技术需掌握多模态大模型 BEV感知强化学习视觉Transformer 扩散模型等跨领域知识学习路径复杂且论文碎片化 [5] - VLM/VLA成为招聘刚需 3-5年经验可冲击百万年薪小米ORION等VLA项目推动行业预研热潮 [2][20] - 学术界与工业界持续探索技术边界但高质量文档缺失实战指导不足影响技术落地效率 [5][26] 课程核心内容设计 - 课程覆盖端到端发展史技术范式比较数据集评测等基础内容重点解析BEV感知扩散模型 VLM等背景知识 [11][12] - 二段式端到端章节分析PLUTO CarPlanner等经典算法对比一段式方案的优缺点 [12] - 精华章节聚焦一段式端到端详解UniAD PARA-Drive OccLLaMA DiffusionDrive等前沿工作配套Diffusion Planner实战 [13][15][17] - VLA方向选取ORION OpenDriveVLA等案例结合BEV 扩散模型强化学习技术展开实战 [20] 技术框架与实战应用 - 课程构建端到端技术框架帮助学员分类论文提取创新点形成研究体系 [7] - 实战环节包括Diffusion Planner代码复现 RLHF微调大作业目标为达到1年算法工程师水平 [17][22][27] - 技术栈覆盖Transformer CLIP LLAVA等基础模型强化学习RLHF GRPO等进阶方法 [18] 行业影响与人才需求 - 端到端技术推动自动驾驶量产方案革新主机厂加速布局算法预研与交付 [23] - 课程面向具备自动驾驶基础及Python/PyTorch能力者目标匹配企业实习校招社招需求 [24][27] - 技术掌握后可应用于场景生成闭环仿真多模轨迹预测等实际场景提升工业落地能力 [15][17]

端到端自动驾驶

端到端自动驾驶算法

《端到端与VLA自动驾驶小班课》

端到端自动驾驶

端到端自动驾驶算法

《端到端与VLA自动驾驶小班课》