VLA论文指导班

搜索文档
师兄自己发了篇端到端VLA,申博去TOP2了。。。
自动驾驶之心· 2025-08-21 19:24
文章核心观点 - 该公众号文章推广第二期VLA论文指导班 旨在通过系统化培训帮助学员在视觉-语言-行动模型领域发表高水平论文 课程提供从理论到实践的全流程支持 包括论文选题 代码实现 实验设计和写作投稿 [2][4][36] - 课程针对自动驾驶感知方向的研究生和学者 特别是资源有限但希望发表顶会论文的群体 通过提供idea 数据集和baseline代码降低研究门槛 [2][4][16] - 采用"2+1"多师制教学团队 包括主导师和科研班主任 提供14周结构化课程和后续论文维护支持 确保学员产出论文初稿 [15][23][25] 课程结构与内容 - 课程为期14周 每周1-1.5小时直播课 涵盖传统端到端自动驾驶 VLA端到端自动驾驶 模块化模型 统一模型和推理增强模型等核心主题 [10][12][32] - 具体课程安排包括:先导课和课题概览(Week1-2) 选题讨论(Week3) 传统端到端自动驾驶介绍(Week4-5) VLA端到端自动驾驶介绍(Week6-7) 模块化VLA模型(Week8-9) 统一端到端模型(Week10-11) 推理增强模型(Week12) 论文写作和投稿指导(Week13-14) [10][12][32] - 提供公开数据集如nuScenes Waymo和Argoverse 以及多个开源baseline代码库包括VAD UniAD DiffusionDrive OccNet OpenDriveVLA SimLingo和Senna [27][28][29] 招生与要求 - 每期限招6人 最多8人 目标学员包括VLA与自动驾驶方向的本硕博学生 申硕申博申请者 以及自动驾驶与AI领域从业者 [13][16] - 学员需具备深度学习基础 熟悉Python和PyTorch 最好有8张4090显卡或以上算力设备 最低要求4张4090 也可租赁云服务器 [17][19][22] - 要求每周课前阅读资料并完成作业 全勤参与讨论 晚交作业或请假需提前1日通知 并保持学术诚信 [20][24] 课程产出与价值 - 学员将获得经典和前沿论文分析方法 理解算法原理和优劣势 激发研究idea思考 即使没有自选idea 导师会为每位学员提供一个研究idea [21][36] - 提升编码能力 在提供的baseline代码和数据集上高效开展实验 掌握论文写作 自查 修改的方法论和投稿建议 [21][36] - 最终产出包括论文初稿 项目结业证书 以及根据优秀程度提供的推荐信 [25][35] 教学支持与资源 - 采用"2+1"师资团队:主导师由名校教授 研究员或行业导师担任 科研班主任全程跟踪进度 解决非学术问题 [23][25][33] - 提供全学习周期服务 包括前期基础测试和学术准备 中期个性化教学和评估跟踪 后期知识复习和报告指导 [25] - 课程有效期3.5-4个月 答疑周期6个月 通过腾讯会议直播和小鹅通回放授课 [33][35]