视觉语言导航(VLN)

搜索文档
这几个方向,从自驾转到具身会比较丝滑......
自动驾驶之心· 2025-07-25 14:47
具身智能实现路径 - 机械臂方向主要依赖VLM、VLA、Diffusion等模块,需要具备模型端和数据端能力,特别是VLM、Diffusion基础及自驾数据采集优化经验[1] - 四足机器人方向以强化学习为主,需熟悉强化学习框架及相关技术[1] - 人形机器人目前有强化学习和VLA两种方案,强化学习相对成熟,VLA受限于关节复杂度落地较难但适合学术研究[1] - 视觉语言导航(VLN)需要SLAM、导航背景,后期依赖大模型进行导航优化[1] 具身智能社区资源 - 社区汇总了40+开源项目、60+数据集及主流仿真平台[14] - 提供30+技术学习路线,涵盖感知、交互、强化学习、VLN、VLA等多领域[14] - 汇总国内外知名高校实验室和头部公司资源,包括斯坦福、清华、智元机器人、优必选等[14][19] - 整理了机器人相关书籍、零部件品牌、研报等资源[22][25][27] 社区特色服务 - 提供岗位内推机制,对接头部具身公司招聘需求[9] - 定期举办圆桌论坛和直播,邀请产业界大佬分享[3] - 成员可自由提问工作选择和研究方向问题并获得解答[73] - 为不同水平用户提供针对性资源,包括小白入门路线和进阶项目方案[10][12] 技术研究方向 - 强化学习领域汇总了基于LLM、可解释、深度强化学习等主流方案[37] - 多模态大模型涵盖理解和生成两大方向,支持多种输入输出组合[47][49] - 机械臂相关技术包括抓取、位姿估计、策略学习等[64] - 仿真平台覆盖通用机器人和真实场景仿真需求[35] 行业应用案例 - 社区成员来自教育、宠物、工业、救援、物流等多个应用领域公司[19] - 具体应用包括机器人导航与规划、触觉感知、视觉语言交互等[43][45] - 双足/四足机器人项目提供从仿真到硬件的完整资源[66] - 移动+执行硬件方案助力快速搭建系统[69]