自动驾驶 - 财报，业绩电话会，研报，新闻

自动驾驶

搜索文档

自动驾驶之心· 2025-12-09 15:59

课程核心内容与定位 - 课程名称为《世界模型与自动驾驶小班课》，是首个面向端到端自动驾驶的进阶实战教程，旨在推动端到端技术在工业界的落地，并助力学员真正理解端到端自动驾驶 [2][10] - 课程由“自动驾驶之心”公众号联合工业界大佬推出，是继《端到端与VLA自动驾驶小班课》后进一步推出的课程，聚焦于通用世界模型、视频生成、OCC生成等世界模型算法 [2] - 课程讲师Jason拥有C9本科和QS50 PhD背景，发表多篇CCF-A/B论文，现任国内TOP主机厂算法专家，主持并完成多项自动驾驶感知和端到端算法的产品量产交付，具备丰富的研发和实战经验 [2] 课程大纲与章节详解 - **第一章：世界模型介绍** 复盘世界模型与端到端自动驾驶的联系，讲解其发展历史、当下应用案例，并介绍纯仿真、仿真+Planning、生成传感器输入、生成感知结果等不同流派，以及它们在业界的应用、解决的问题、所处环节、相关数据集和评测 [5] - **第二章：世界模型的背景知识** 讲解世界模型的基础知识，包括场景表征、Transformer、BEV感知等，为后续章节奠定基础，其内容是当下世界模型求职面试频率最高的技术关键词 [5][6] - **第三章：通用世界模型探讨** 聚焦通用世界模型和近期热门工作，涵盖李飞飞团队的Marble、DeepMind的Genie 3、Meta的JEPA、导航世界模型，以及业界广泛讨论的VLA+世界模型算法DriveVLA-W0和特斯拉ICCV上分享的世界模型模拟器 [6] - **第四章：基于视频生成的世界模型** 聚焦视频生成类世界模型算法，从Wayve的GAIA-1 & GAIA-2开始，扩展到上交CVR'25的UniScene、商汤的OpenDWM、中科大ICCV'25的InstaDrive，兼顾经典与前沿进展，并以商汤开源的OpenDWM进行实战 [7] - **第五章：基于OCC的世界模型** 聚焦OCC生成类世界模型算法，包含三大论文讲解和一个项目实战，此类方法不局限于OCC生成，可较易扩展为自车轨迹规划，从而进一步实现端到端 [8] - **第六章：世界模型岗位专题** 基于前五章算法基础，分享工业界应用经验，探讨行业痛点、期望解决的问题，以及如何准备相关岗位面试和公司真正关注的内容 [9] 课程技术深度与学后收获 - 课程将详细讲解Transformer、视觉Transformer、CLIP、LLAVA、BEV感知、占用网络(Occupancy Network)、扩散模型、闭环仿真、NeRF、3DGS、VAE、GAN及Next Token Prediction等关键技术概念 [11] - 课程涵盖OCC生成类世界模型的多个前沿工作，包括清华的OccWorld、复旦的OccLLaMA、华科ICCV'25的HERMES以及西交最新的II-World [12] - 学员学完本课程后，预期能够达到1年左右世界模型自动驾驶算法工程师水平，掌握世界模型技术进展（涵盖视频生成、OCC生成等方法），对BEV感知、多模态大模型、3DGS、扩散模型等关键技术有更深刻了解，并可复现II-World、OpenDWM等主流算法框架，能够将所学应用到项目设计中，对实习、校招、社招均有助益 [13] 课程安排与面向人群 - 课程开课时间为1月1号，预计两个半月结课，采用离线视频教学，辅以VIP群内答疑和三次线上答疑 [14] - 章节解锁时间安排如下：第一章于12月10日解锁，第二章于1月1日解锁，第三章于1月20日解锁，第四章于2月4日解锁，第五章于2月24日解锁，第六章于3月1日解锁 [14] - 面向人群需自备GPU（推荐算力在4090及以上），具备一定的自动驾驶领域基础，熟悉自动驾驶基本模块，了解transformer大模型、扩散模型、BEV感知等技术的基本概念，具备一定的概率论、线性代数基础以及Python和PyTorch语言基础 [13]