文章核心观点 - 文章核心是推广一门关于自动驾驶世界模型的进阶实战课程 课程旨在帮助学习者理解并掌握这一前沿技术 推动端到端自动驾驶在工业界的落地[1][11] - 世界模型被视为智能驾驶能力上限的关键 其核心是建立高带宽的时空认知系统 以视频为核心学习物理规律 不同于解决概念认知的语言模型[1] - 行业对世界模型的定义尚不统一 初学者入门困难 该课程由业界专家设计 从原理到实战系统讲解 目标是使学员达到具备一年经验的算法工程师水平[1][14] 课程内容与结构 - 课程共六章 从概述、背景知识到具体模型流派及工业应用 循序渐进[4][6][7][8][9][10] - 第一章介绍世界模型与端到端自动驾驶的联系、发展历史、应用案例及不同流派(如纯仿真、仿真+规划、生成传感器输入等)[6] - 第二章讲解世界模型所需的基础技术栈 包括场景表征、Transformer、BEV感知、占用网络、扩散模型、闭环仿真(NeRF/3DGS)及其他生成式模型(VAE、GAN等)[6][12] - 第三章探讨通用世界模型 解析Marble、Genie 3、V-JEPA、DriveVLA-W0及特斯拉世界模型模拟器等热门工作[7] - 第四章聚焦视频生成类世界模型 涵盖GAIA-1 & GAIA-2、UniScene、OpenDWM、InstaDrive等 并以商汤OpenDWM进行实战[8] - 第五章聚焦OCC生成类世界模型 讲解OccWorld、OccLLaMA、HERMES、II-World等论文并进行项目实战 此类方法可扩展至轨迹规划[9][13] - 第六章分享工业界应用经验、行业痛点、问题解决思路及世界模型相关岗位的面试准备[10] 讲师与课程安排 - 讲师Jason拥有C9本科和QS50博士学历 发表多篇CCF-A/B论文 现任国内顶级主机厂算法专家 主持并完成多项自动驾驶感知与端到端算法的量产交付 拥有丰富的前沿算法预研和实战经验[3] - 课程为离线视频教学 于1月1日开课 预计两个半月结课 提供VIP群答疑及三次线上答疑 答疑服务截止2026年12月31日[15] - 章节内容按计划逐步解锁 例如第一章于12月10日解锁 第六章于3月1日解锁[16] 目标受众与学习收获 - 课程面向具备一定基础的学习者 要求自备GPU(推荐算力在4090及以上) 熟悉自动驾驶基本模块 了解Transformer、扩散模型、BEV感知等基本概念 并具备概率论、线性代数及Python/PyTorch编程基础[14] - 学员学完后将掌握世界模型技术进展(视频生成、OCC生成等) 对BEV感知、多模态大模型等关键技术有更深刻理解 能够复现II-World、OpenDWM等主流算法框架 并能将所学应用于实际项目设计[14] - 该课程有助于学员在实习、校招和社招中受益[14]
为什么蔚来会押注世界模型?
自动驾驶之心·2025-12-31 14:27