Workflow
端到端算法
icon
搜索文档
一个在量产中很容易被忽略重要性的元素:导航信息SD
自动驾驶之心· 2025-12-26 09:56
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 最近和业内专家讨论了导航信息SD如何应用到自动驾驶中,分享给大家: 图商提供的导航信息SD/SD Pro目前已经在很多量产方案上使用了。导航可以提供车道、粗粒度的waypoint等信息,相当于给司机提供了一个粗略的全局和局部视 野,将导航信息应用到车端模型上也就顺水渠成。目前来看,导航模块的核心职责有两个: 当然还有非常重要的一part,提供参考线reference line,这是下游规控强需的信息,有了参考线,可以极大的减轻规划的压力,相当于车辆已经有一条行驶的参考路 线,只需在细化即可。 除此之外,还可以提供规划约束与优先级、路径监控和重规划。 1. 车道级的全局路径规划:搜索一条目标车道的最优lane sequence; 2. 给行为规划提供明确的语义指导,方便车辆提前准备变道、减速、让行; 具体涉及到自车定位、道路结构构建和感知定位匹配可以参考下图: 在两段式中,导航输入到感知模型中,输出navi path,navi path作为ml planner的输入进而预测自车的行驶轨迹。 本文均出自平台最新推 ...
一见Auto采访小米陈光的一些信息分享......
自动驾驶之心· 2025-12-26 09:56
以下文章来源于一见Auto ,作者易思琳 一见Auto . 汽车竞争中的野心、方法论与新秩序。21世纪经济报道旗下汽车报道品牌。 作者 | 易思琳 来源 | 见谈|小米陈光:我们不想制造技术焦虑了 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 理想汽车智驾团队从端到端+世界模型全面切向VLA(Vision Language Action),在算法架构中引入大语言模型(LLM)。和理想一样坚定选择VLA的还 有智驾供应商元戎启行。 行业里也有坚定的VLA反对派。华为表示,不会走向VLA,而是会坚定选择WA(World Action,世界模型)。和华为一样尝试去掉Language环节的还有小 鹏。 而在这场争鸣中,端到端仍展现出巨大的潜力,小米汽车就是在这一方向持续深耕的企业。 "现在竞争太激烈,大家会产生一些焦虑,倾向于通过各种方式或技术让用户觉得更先进。"小米汽车端到端负责人陈光告诉《21汽车·一见Auto》, "但无 论VA、WA还是VLA,在我看来其实都一样,都 ...
小米陈光:我们不想制造技术焦虑了
21世纪经济报道· 2025-12-25 16:24
2025年,智能驾驶行业出现"名词过载"现象,从VLA、VA、到WA,分化出多个派别,争鸣不断。 理想汽车智驾团队从端到端+世界模型全面切向VLA(Vision Language Action),在算法架构中引入大 语言模型(LLM)。和理想一样坚定选择VLA的还有智驾供应商元戎启行。 行业里也有坚定的VLA反对派。华为表示,不会走向VLA,而是会坚定选择WA(World Action,世界 模型)。和华为一样尝试去掉Language环节的还有小鹏。 而在这场争鸣中,端到端仍展现出巨大的潜力,小米汽车就是在这一方向持续深耕的企业。 "现在竞争太激烈,大家会产生一些焦虑,倾向于通过各种方式或技术让用户觉得更先进。"小米汽车端 到端负责人陈光告诉《21汽车·一见Auto》,"但无论VA、WA还是VLA,在我看来其实都一样,都是看 如何让模型的智能密度最大。" 现有头部新势力中,小米汽车启动端到端研发较晚。2024年,小米在内部正式整合成立"端到端算法与 功能部",负责量产方案开发。而理想、蔚来都比小米早了至少3个月。 但小米追赶很快。今年2月,小米正式向用户全量推送了300万Clips的端到端(HAD),7月再次 ...
聊聊导航信息SD如何在自动驾驶中落地?
自动驾驶之心· 2025-12-23 08:53
导航信息在自动驾驶中的应用 - 图商提供的导航信息SD/SD Pro已在多个量产方案中使用,为车辆提供车道、粗粒度路径点等全局与局部视野信息,其应用顺理成章 [2] - 导航模块的核心职责之一是提供参考线,这能极大减轻下游规划控制模块的压力,车辆只需在参考线基础上进行细化 [4] - 导航模块还负责提供规划约束与优先级、路径监控和重规划等功能 [5] - 具体应用包括:进行车道级的全局路径规划,搜索目标车道的最优车道序列;为行为规划提供明确语义指导,方便车辆提前准备变道、减速、让行等操作 [6] 端到端自动驾驶算法框架 - 在两段式框架中,导航信息输入到感知模型,输出导航路径,该路径再作为机器学习规划器的输入,用于预测自车行驶轨迹 [16] - 在一段式框架中,SD信息经过专用编码器编码后,与动静态信息一同作为输入,参与后续的模型优化 [20] - 一段式框架相比两段式能做到信息无损传递,因此在性能上更具优势 [30] 行业课程内容概述 - 课程聚焦自动驾驶端到端技术的落地应用,涵盖一段式、两段式、强化学习、导航应用、轨迹优化及量产经验分享 [23] - 课程由工业界算法专家联合开设,讲师为国内顶级一级供应商算法专家,拥有大模型、世界模型等前沿算法的预研和量产落地经验 [25] - 课程面向进阶学员,需自备算力在4090及以上的GPU,并具备BEV感知、视觉Transformer、强化学习等算法基础 [38] - 课程采用离线视频教学,配合VIP群答疑及三次线上答疑,学习周期预计三个月 [36] 课程核心章节大纲 - 第一章概述端到端任务,介绍感知模型一体化架构、规控算法学习化方案及开源数据集与评测方式 [28] - 第二章详解两段式端到端算法框架,包括其建模方式、感知与规划控制的信息传递,并通过PLUTO算法进行实战 [29] - 第三章讲解一段式端到端算法框架,介绍基于向量逻辑架构和扩散模型等多种方案,并深入学习VAD系列方法 [30] - 第四章专述导航信息的量产应用,涵盖主流导航地图格式、内容信息及其在端到端模型中的编码与嵌入方式 [31] - 第五章介绍自动驾驶中的强化学习算法,旨在弥补纯模仿学习的不足,使系统学习因果关系以实现泛化 [32] - 第六章进行神经网络规划器项目实战,重点涵盖基于扩散模型和自回归模型的模仿学习,并结合强化学习算法 [33] - 第七章讲解量产兜底方案——时空联合规划,介绍多模态轨迹打分搜索及轨迹平滑等后处理优化算法 [34] - 第八章分享端到端量产经验,从数据、模型、场景、规则等多视角剖析如何提升系统能力边界 [35]
端到端落地中可以参考的七个Project
自动驾驶之心· 2025-12-19 08:05
行业技术趋势与人才需求 - 自动驾驶行业端到端技术路线已被头部玩家验证可行 其他车企正跟进投入人力和资源 [2] - 导航信息、强化学习、扩散模型、自回归、时空联合规划是当前端到端量产落地最重要的技术栈 [2] - 行业面临人才挑战 候选人往往只懂部分技术 在导航信息引入、强化学习调优、轨迹建模优化等具体量产经验上存在痛点 [2] 课程核心内容与结构 - 课程为期三个月 包含七个实战项目 聚焦量产应用 [2] - 课程核心算法涵盖一段式端到端、两段式端到端、导航信息量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等 [2] - 课程最终章节将分享从数据、模型、场景、规则等多视角的量产经验 [14] 技术模块详解 - **第一章:端到端任务概述** 介绍感知任务合并与规控算法learning化的主流趋势 讲解感知模型一体化架构和规控learning化方案 并介绍开源数据集与评测方式 [7] - **第二章:两段式端到端算法** 讲解两段式框架建模及感知与PNC信息传递方式 分析其优缺点 并通过PLUTO算法进行实战 [8] - **第三章:一段式端到端算法** 介绍一段式框架 其可实现信息无损传递 性能优于两段式 涵盖基于VLA和基于Diffusion等方法 并通过VAD系列进行深入学习 [9] - **第四章:导航信息量产应用** 讲解导航地图的格式与内容 及其在端到端模型中的编码与嵌入方式 以更有效发挥导航能力 [10] - **第五章:自动驾驶中的RL算法** 在模仿学习基础上引入强化学习以解决人类驾驶风格差异和corner-case场景数据稀缺问题 实现模型泛化 重点介绍强化学习算法及训练策略 [11] - **第六章:端到端轨迹输出优化** 进行nn planner项目实战 包括基于模仿学习的扩散模型与自回归算法 以及后续的强化学习算法 [12] - **第七章:时空联合规划兜底方案** 介绍量产中用于轨迹平滑优化的后处理兜底逻辑 包括多模态轨迹打分搜索算法和轨迹平滑算法 以保证输出轨迹稳定可靠 [13] 课程安排与学员要求 - 课程采用离线视频教学 配合VIP群答疑及三次线上答疑 答疑服务截止2026年11月30日 [15] - 课程从11月30日开始 按周或双周解锁新章节 至次年2月24日完成全部八章内容 [16][18] - 课程面向进阶学员 建议自备算力在4090及以上的GPU 并熟悉BEV感知、视觉Transformer、端到端算法、强化学习、扩散模型理论 具备Python、PyTorch及mmdet3d框架基础 [17]
中游智驾厂商正在快速抢占端到端人才......
自动驾驶之心· 2025-12-15 08:04
行业技术发展趋势 - 智能驾驶领域的技术焦虑正在产业链中游厂商间快速传播[1] - 业内认为,端到端等前沿技术的大规模量产起点将在明年[2] - 当前智驾前沿技术发展放缓,量产方案趋同,L2级智能驾驶正走下沉路线[2] - 随着明年L3法规的进一步推进,中游厂商面临迫切的技术升级压力[2] - 近期许多公司的算法负责人正积极寻求了解端到端、世界模型、VLA、3DGS等前沿技术[2] 市场与量产现状 - 中国二十万以上的乘用车年销量约为700万辆[2] - 头部新势力品牌在此价格区间的销量占比不及三分之一[2] - 已实现端到端技术量产的车型占比更低[2] - 端到端技术的成熟被视为开启更大规模量产的关键[2] - 地平线公司宣布将进军10万级市场,表明高阶智驾正迅速向更多国民车型下沉[2] 技术实施与人才需求 - 端到端自动驾驶不仅仅是一个算法,其落地需要完善的云端与车端基础设施、数据闭环、工程部署、闭环测试、模型优化及平台开发等全套能力[2] - 可以预见,市场对中阶智能驾驶相关岗位的需求将更加旺盛[2] - 端到端和VLA(视觉语言动作模型)领域的招聘需求预计将显著增长[3] 行业培训动态 - 为应对技术升级需求,市场出现了针对端到端和VLA技术的实战培训课程[3] - 相关课程由工业界与学术界的专家联合开展,聚焦量产落地[3] - 课程内容涵盖导航信息应用、强化学习优化、Diffusion和自回归模型量产经验、时空联合规划等核心模块[3] - 另有课程专门梳理BEV感知、大语言模型、扩散模型和强化学习在端到端领域的应用,并设计相关实战项目[6] - 针对VLA领域,有课程从VLM(视觉语言模型)解释器到模块化、一体化及推理增强VLA进行全面梳理,并包含从零搭建模型的大作业[11] - 课程讲师及团队背景雄厚,多来自国内顶级主机厂、Tier1供应商及顶尖高校,拥有丰富的算法研发、预研及量产交付经验[5][8][13][14]
2025年还存活的自动驾驶公司......
自动驾驶之心· 2025-12-14 10:03
行业现状与趋势 - 智能驾驶行业正处于快速发展与整合阶段,L2级别自动驾驶渗透率正在快速提升,L3级别自动驾驶即将落地,L4级别自动驾驶正在寻求规模上的突破 [2] - 行业技术方向持续演进,包括端到端、视觉-语言-动作模型、世界模型、强化学习等前沿领域仍在快速发展 [2] - 行业经历新一轮洗牌与资源整合,部分公司已退出市场,部分公司正进行合并或收购,同时也有新势力公司涌现 [2] 主要市场参与者分类 - **新势力公司**:主要包括蔚来、小鹏、理想、小米、零跑、滴滴、威马、牛创、极氪、阿维塔、岚图、千里科技、极越等 [4] - **一级供应商**:主要包括华为、百度、大疆、中兴、腾讯、上汽零束、鉴智机器人、Momenta、博世中国、麦格纳、佑驾创新等 [6] - **Robotaxi公司**:主要包括百度、小马智行、上海造父智能科技、文远知行、元戎启行、滴滴、Momenta、轻舟智航、驭势科技等 [8] - **Robotruck公司**:主要包括卡尔动力、智加科技、赢彻科技、小马智行、主线科技、斯年智驾、西井科技、飞步科技、牧月科技、挚途科技等 [10] - **无人配送公司**:主要包括美团、九识智能、京东、苏宁、阿里菜鸟、中国邮政、百度Apollo、威盛电子、新石器、白犀牛等 [12] - **传统主机厂**:主要包括上汽、长安、广汽、北汽、一汽、长城、比亚迪、吉利、东风、奇瑞等 [14] - **农用自动驾驶公司**:主要包括丰疆智能、中联重科、中国一拖、悟牛智能、中科原动力、雷沃重工等 [16] - **矿区自动驾驶公司**:主要包括易控智驾、踏歌智行、慧拓智能、路凯智行、伯镭科技、盟识科技、清智科技等 [18] - **环卫自动驾驶公司**:主要包括智行者、酷哇、仙途、高仙机器人、深兰科技、浩睿智能、于万智驾、云创智行等 [20] - **自动泊车公司**:主要包括百度、追势、德赛西威、东软睿驰、禾多科技、纽励科技、恒润科技等 [22] - **高精地图公司**:主要包括百度、高德、四维图新、腾讯、华为、滴滴、京东、美团、宽凳等 [24] - **车路协同公司**:主要包括蘑菇车联、觉非科技、百度、华为、大唐高鸿、华砺智行、阿里、海康等 [24] 核心技术课程内容 - 课程涵盖端到端自动驾驶算法的核心内容,包括任务概述、两段式与一段式算法框架及经典算法 [29] - 课程包含导航信息在量产中的应用,涉及导航信息分类、编码及量产经验分享 [29] - 课程讲解自动驾驶中的强化学习,包括其解决的问题、环境配置、算法框架详解及开闭环训练 [29] - 课程涉及端到端轨迹优化技术,包括基于扩散模型和基于子回顾的优化方法,并结合强化学习进行实战 [29] - 课程包含时空联合规划与轨迹打分、搜索算法、横纵向轨迹平滑,并详解线性二次调节器及其迭代算法,分享量产经验 [30] - 课程提供端到端算法的量产经验分享,涵盖模型优化、场景优化与数据优化的思路 [30] 行业人才需求与薪酬 - 端到端自动驾驶算法工程师岗位要求3-5年经验及硕士学历,薪酬范围在每月50-80K,按14薪计算 [31] - 端到端自动驾驶算法部署工程师岗位要求3-5年经验及硕士学历,薪酬范围在每月40-70K,按14薪计算 [31] - 端到端自动驾驶大模型工程师岗位要求5-10年经验及本科学历,薪酬范围在每月30-60K,按16薪计算 [31] - 自动驾驶端到端规划模型算法工程师岗位对经验要求不限但需硕士学历,薪酬范围在每月35-60K,按14薪计算 [31] - 辅助驾驶产品总监岗位要求5-10年经验及本科学历,薪酬范围在每月40-70K [31]
正式开课!7个Project搞懂端到端落地现状
自动驾驶之心· 2025-12-12 11:02
行业招聘需求与技术趋势变化 - 自动驾驶行业招聘需求正发生变化,两年前热门的感知岗位需求进一步收缩 [2] - 当前行业需求较高的技术方向集中在端到端、视觉语言动作模型和世界模型等领域 [2] - 头部玩家已验证端到端技术路径可行,其他车企正跟进投入人力和资源,从模型、场景、数据优化到下游规划兜底进行布局 [2] - 市场面临合格候选人供给不足的挑战,候选人往往只精通部分技术栈,而相关岗位要求广泛的技术能力 [2] - 具体的量产经验,如导航信息引入、强化学习调优、轨迹建模及优化,是实际落地中的关键痛点和门道 [2] 课程核心定位与内容设计 - 课程名称为《面向量产的端到端实战小班课》,核心重点是聚焦量产应用 [2] - 课程设计历时三个月,包含七个实战项目,从实战到落地层层展开 [2] - 课程核心算法覆盖一段式端到端、两段式端到端、导航信息量产应用、开闭环强化学习、扩散模型结合强化学习、自回归结合强化学习、时空联合规划等 [2] - 课程最终会分享实际的量产经验,目标面向就业与直接落地 [2] - 课程采用小班制,目前仅剩20个招生名额 [2][4] 端到端技术架构演进与核心模块 - 在端到端时代,感知任务的合并与规控算法的学习化已成为绝对主流 [7] - 如何更高效合并感知任务及设计规控的学习化模块是各大公司的核心必备技能 [7] - 两段式端到端框架涉及感知与规划控制的建模及信息传递方式,有其特定优缺点 [8] - 一段式端到端框架可实现信息的无损传递,因此在性能上通常优于两段式方案,具体方法包括基于视觉语言动作模型和基于扩散模型的方法等 [9] - 导航信息在自动驾驶中起引导、选路、选道的关键作用,其地图格式、内容及在端到端模型中的编码与嵌入方式是重要课题 [10] 算法训练策略与量产保障方案 - 仅依靠模仿学习存在局限,因人类驾驶风格迥异且部分极端场景数据难采集,需结合强化学习以学习因果关系并实现泛化 [11] - 课程项目实战涵盖基于模仿学习的算法,并重点介绍基于扩散模型和自回归的算法,在监督微调后会继续讲解强化学习实战 [12] - 在量产落地阶段,为确保轨迹稳定可靠,需有后处理的兜底逻辑,例如通过轨迹平滑优化算法对模型直出结果进行优化 [13] - 时空联合规划是重要的兜底方案,涉及多模态轨迹打分搜索及轨迹平滑等算法 [13] - 量产经验分享将从数据、模型、场景、规则等多个视角,剖析如何选用合适工具和策略以快速提升系统能力边界 [14] 课程安排与学员要求 - 课程面向进阶学员,开课时间为11月30日,预计三个月结课,采用离线视频教学配合VIP群答疑及三次线上答疑的形式 [15] - 课程章节按计划解锁,例如第一章于11月30日解锁,第二章于12月7日解锁,后续章节按周或月间隔陆续开放 [16][18] - 学员需自备图形处理器,推荐算力在4090及以上 [17] - 学员需具备的基础知识包括:熟悉自动驾驶鸟瞰图感知、视觉Transformer、端到端等常见算法;掌握强化学习、扩散模型理论基础;具备一定的Python和PyTorch语言基础;熟悉mmdet3d算法框架;以及一定的高等数学、线性代数和矩阵论基础 [17]
地平线冲进 10 万级市场,认为智驾是新时代的 “自动挡”
晚点Auto· 2025-12-10 23:45
地平线的战略目标与市场定位 - 公司提出新目标:基于单征程6M芯片,为售价最低7万元的车型提供城区辅助驾驶方案,实现跟车、变道、超车等接近人类驾驶风格的功能 [3] - 公司计划在未来三到五年,通过与博世、元戎启行、轻舟智航、大众等厂商合作,推动其自研智驾算法HSD达成千万套量产规模 [3] - 公司瞄准13万元以下车型市场,该价格区间在今年前三季度占中国乘用车市场约50%份额,但基本不具备城区辅助驾驶功能 [3] 市场机会与竞争格局 - 10万元以下价格区间此前鲜有厂商涉足高阶城区智驾,主要受限于苛刻的芯片算力、算力利用率、算法模型条件以及用户对价格高度敏感 [3] - 公司提出“在没有竞争的地方竞争”的策略,当前搭载两颗英伟达Orin-X芯片最便宜的车型售价也达到12.98万元 [4] - 公司面临来自智驾供应商Momenta(芯片自研进展迅速)和高通(8775P芯片已有量产客户)的竞争 [4] - 行业头部厂商发展道路趋同,均走向软硬一体、极致降本,为更主流车型提供全栈解决方案 [9] 技术路径与产品战略 - 公司将高阶城区辅助驾驶比作新时代的“自动挡”,认为其应是汽车的基本素质而非情绪价值 [4] - 实现愿景面临双重门槛:在7万元车型上复刻25万元车型的智驾体验,同时守住成本红线,前者考验算法与工程能力,后者依赖规模效应 [4] - 公司从过去的“国产替代”追赶英伟达路线,转向开发更广阔的市场需求,以尽快扩大市场份额获得规模优势 [10] - 公司计划坚持每一代芯片和产品实现十倍算力提升、十倍模型容量叠加,其第五代芯片征程7系列计划与特斯拉下一代AI5芯片同步推出 [10] 征程6系列芯片的关键作用 - 征程6系列是让公司上智驾牌桌的重要产品,其征程6M芯片可实现城市NOA,征程6P算力达560 TOPS [11] - 该系列芯片提前预判市场需求,适配Transformer架构和“端到端”算法,以支持城市NOA [11] - 公司CEO修正了此前判断,认为随着端到端等新算法框架出现,智能驾驶行业将在2025年迎来拐点,并展望“3年实现脱手开、5年实现闭眼开、10年实现随心开” [11] - HSD智驾方案的千万套出货目标能否实现,主要取决于征程6系列的上车表现 [10] - 公司自研并开放HSD方案,旨在提高HSD出货量,因为有能力基于征程芯片自研城市NOA的供应商是少数 [10]
世界模型自动驾驶小班课!特斯拉世界模型、视频&OCC生成速通
自动驾驶之心· 2025-12-10 03:00
课程核心定位 - 课程为自动驾驶领域首个面向端到端自动驾驶的进阶实战教程,旨在推动端到端技术在工业界的落地,并助力学员深入理解端到端自动驾驶 [11] - 课程聚焦于通用世界模型、视频生成、OCC生成等世界模型算法,涵盖特斯拉世界模型、李飞飞团队Marble等前沿工作 [1] - 课程由工业界专家授课,内容基于讲师丰富的端到端算法研发和量产实战经验 [3] 讲师背景 - 讲师Jason拥有C9本科和QS50高校的博士学位,已发表多篇CCF-A/B类论文 [3] - 现任国内顶级主机厂算法专家,从事端到端、大模型、世界模型等前沿算法的预研和量产,并已主持完成多项自动驾驶感知和端到端算法的产品量产交付 [3] 课程大纲与内容结构 - **第一章:世界模型介绍** 复盘世界模型与端到端自动驾驶的联系,讲解其发展历史、应用案例、不同技术流派(如纯仿真、仿真+Planning、生成传感器输入等)及其在业界解决的问题和所处环节,并介绍相关数据集与评测 [6] - **第二章:世界模型的背景知识** 讲解世界模型的基础知识,包括场景表征、Transformer、BEV感知等,这些内容是当前世界模型求职面试频率最高的技术关键词 [6][7] - **第三章:通用世界模型探讨** 聚焦通用世界模型及近期热门工作,详细讲解李飞飞团队的Marble、DeepMind的Genie 3、Meta的JEPA、导航世界模型,以及VLA+世界模型算法DriveVLA-W0和特斯拉ICCV分享的世界模型模拟器 [7] - **第四章:基于视频生成的世界模型** 聚焦视频生成类世界模型算法,讲解Wayve的GAIA-1 & GAIA-2、上海交通大学的UniScene、商汤的OpenDWM、中科大的InstaDrive等经典与前沿工作,并以商汤开源的OpenDWM进行实战 [8] - **第五章:基于OCC的世界模型** 聚焦OCC生成类世界模型算法,包含三大论文讲解和一个项目实战,此类方法可扩展至自车轨迹规划,进而实现端到端 [9] - **第六章:世界模型岗位专题** 基于前五章算法基础,分享工业界应用经验、行业痛点、期望解决的问题,以及相关岗位面试准备与公司关注重点 [10] 关键技术覆盖与学后收获 - **关键技术覆盖** 课程将详细讲解Transformer、视觉Transformer、CLIP、LLaVA、BEV感知、占用网络、扩散模型、闭环仿真、NeRF、3DGS、VAE、GAN及Next Token Prediction等生成式模型 [12] - **核心算法掌握** 学员将掌握世界模型技术进展,涵盖视频生成、OCC生成等方法,并对BEV感知、多模态大模型、3DGS、扩散模型等关键技术有更深刻了解 [14] - **实战能力目标** 学员学完后能够复现II-World、OpenDWM等主流算法框架,能够将所学应用到项目中,设计自己的世界模型,达到约1年经验的自动驾驶算法工程师水平 [14] - **职业发展受益** 课程内容对实习、校招、社招均有助益 [14] 课程进度与安排 - 课程于1月1日开课,预计两个半月结课,采用离线视频教学,并提供VIP群答疑及三次线上答疑,答疑服务截止2026年12月31日 [15] - 各章节解锁时间安排如下:第一章于12月10日解锁,第二章于1月1日解锁,第三章于1月20日解锁,第四章于2月4日解锁,第五章于2月24日解锁,第六章于3月1日解锁 [16] 面向人群与先修要求 - **面向人群** 课程面向具备一定自动驾驶领域基础,熟悉基本模块的学员 [14] - **先修知识要求** 学员需了解transformer大模型、扩散模型、BEV感知等基本概念,具备一定的概率论、线性代数基础,以及Python和PyTorch编程能力 [14] - **硬件要求** 学员需要自备GPU,推荐算力在RTX 4090及以上 [14]