机器人导航

搜索文档
有几个Top具身公司的大模型、强化学习、VLA和具身导航岗位!
具身智能之心· 2025-07-10 11:36
多模态大模型职位 - 工作地点为北京和深圳,月薪范围为40k-80k [2] - 研究方向包括移动操作、导航和VLA(视觉语言行动) [2] - 职责涵盖具身智能大模型框架设计、模型优化及下游任务训练部署 [2] - 要求计算机/人工智能/机器人相关专业硕士学历,具备机器人感知/导航/操作或AI大模型经验 [3] - 优先考虑有NaVid/MobilityVLA等机器人导航领域算法落地经验者 [3] - 加分项包括顶级会议论文发表、熟悉Transformer/RLHF算法、多模态数据处理经验 [4] 强化学习职位 - 工作地点为北京,月薪范围为40k-80k [5] - 研究方向包括强化学习和VLA [5] 具身导航算法职位 - 工作地点为深圳,月薪范围为30k-60k [6] - 研究方向包括多模态和VLN(视觉语言导航) [6] - 职责涉及多模态数据到规划的端到端映射及世界模型应用 [6][7] - 要求计算机/自动化/电子相关专业,具备机器学习/深度学习/强化学习基础 [7] - 优先考虑有ICLR/NeurIPS等论文发表或ACM/ICPC竞赛获奖者 [7] 岗位咨询方式 - 可通过添加微信Remix-clover咨询多模态导航移动基础模型相关岗位 [9] - 咨询需备注"具身之心+具体岗位" [9]
我在哪?要去哪?要怎么去?字节跳动提出Astra双模型架构助力机器人自由导航
机器之心· 2025-06-23 17:39
传统导航瓶颈与Astra的创新 - 传统导航系统面临目标定位、自我定位与路径规划三大核心挑战,在复杂场景中依赖人工地标如QR码,模块化设计导致效率低下 [3] - 字节跳动研发的双模型架构Astra突破传统瓶颈,采用System 1/System 2理念:Astra-Global处理低频定位任务,Astra-Local执行高频路径规划与里程计估计 [4][5] - Astra-Global作为多模态大语言模型,通过混合拓扑语义图实现视觉-语言精准定位,支持自然语言指令解析如"找到打印机" [8][11] Astra-Global技术细节 - 离线构建混合拓扑语义图包含节点(V)、几何连通边(E)和语义地标(L),通过SfM估计6自由度相机位姿,地标共视图增强场景理解 [10] - 采用两阶段定位流程:粗定位阶段匹配地标与预建地图,精定位阶段直接输出预测位姿,仓库环境位姿精度比传统方法提升30%+ [11][20] - 以Qwen2.5-VL为骨干,结合SFT和GRPO训练,零样本场景定位准确率达99.9%,超越SFT-only方法的93.7% [12] Astra-Local技术实现 - 4D时空编码器通过ViT和Lift-Splat-Shoot技术将2D图像转为3D voxel特征,自监督学习结合伪深度标签优化 [15] - 规划头采用Transformer流匹配生成轨迹,掩码ESDF损失使OOD数据集碰撞率显著低于ACT和扩散策略方法 [16][23] - 里程计头融合IMU/车轮数据,旋转估计精度提升后轨迹误差降至2%,多传感器融合增强尺度稳定性 [17][23] 实验验证与性能 - Astra-Global在文本/图像定位中展现优势,精准捕捉房间号等细节,视点变化下位姿误差范围1米/5度 [20] - 仓库场景中规划头碰撞率低于基线方法,里程计头加入IMU后轨迹误差改善至2%水平 [23] - 家庭环境测试显示SFT+GRPO方法定位准确率99.9%,显著优于纯监督学习的93.7% [12] 应用前景与改进方向 - 潜在应用场景扩展至商场导购、医院物资运输和图书馆书籍整理等复杂室内环境 [25] - 需改进地图表示的语义细节保留,未来研究替代压缩方法并引入主动探索机制 [25] - Astra-Local将增强OOD场景鲁棒性,集成指令跟随能力以实现自然语言交互 [26]
还不知道发什么方向论文?别人已经投稿CCF-A了......
具身智能之心· 2025-06-18 11:03
具身智能之心论文辅导服务 - 核心观点:提供具身智能领域的论文辅导服务,帮助学员冲击顶级会议 [1] - 辅导方向包括多模态大模型、机器人导航、机器人抓取、具身泛化、具身合成数据、端到端具身智能体、3DGS等 [2] - 辅导老师均在CVPR、ICCV、ECCV、ICLR、RSS、ICML、ICRA等顶级会议发表过论文 [3] 学员要求 - 需要自带简历,学校背景要求国内TOP100高校或国外QS200以内 [5] - 详细内容可通过微信咨询 [5]