Workflow
VLA科研论文辅导课程
icon
搜索文档
传统感知和规控,打算转端到端VLA了...
自动驾驶之心· 2025-07-28 11:15
端到端VLA技术发展现状 - 端到端自动驾驶技术分为一段式与二段式两大方向 一段式包括基于感知(UniAD)、世界模型(OccWorld)、扩散模型(DiffusionDrive)等子领域 二段式以PLUTO为代表 [2] - 基于VLM的方法推动自动驾驶进入大模型时代 形成VLA(Vision-Language-Action)新方向 传统BEV感知、多传感器融合等技术已相对成熟 学术界研究热点明显转移 [2] - 工业界仍在优化传统感知规划方案 但学术界研究资源已集中投向大模型与VLA领域 该领域存在大量待探索的子方向 [2] VLA科研辅导课程设计 - 课程采用"2+1"多师制 主导师由名校教授/行业专家担任 配备科研班主任全程督导 包含12周在线科研+2周论文指导+10周维护期 [11][14] - 提供完整科研闭环支持:从经典/前沿论文分析(PLUTO/UniAD等)、baseline代码(VAD/DiffusionDrive等开源项目)、数据集(nuScenes/Waymo)到论文写作投稿全流程 [8][18] - 硬件要求最低配置4张NVIDIA 4090显卡 推荐8张 支持云服务器租赁方案 [12] 目标学员与课程产出 - 面向本硕博学生 需掌握Python/PyTorch基础 通过1v1面试考核 课程包含先修课强化深度学习与自动驾驶算法基础 [6][12] - 学员将获得:论文初稿(含导师定制idea)、结业证书、推荐信(优秀者) 以及系统的科研方法论与coding能力提升 [11][15] - 解决三大核心痛点:知识碎片化问题(建立VLA体系)、动手能力差问题(复现SOTA模型)、论文写作障碍(提供写作模板与投稿策略) [7] 技术资源支持 - 开源框架覆盖主流技术路线:基于模仿学习(UniAD/VAD)、扩散模型(DiffusionDrive/OccNet)、VLA(OpenDriveVLA/SimLingo)等 [18] - 必读论文包括Senna(视觉语言模型与自动驾驶桥接)、ORION(语言指令生成行动框架)等5篇顶会前沿研究 [18] - 采用腾讯会议直播+小鹅通回放形式 提供6个月答疑周期 严格学术诚信要求(剽窃零容忍) [14][20][21]