银河通用全新模型统一机器人导航任务,7B参数模型支持实时部署
量子位·2025-11-09 15:01
NavFoM团队 投稿 量子位|公众号 QbitAI 导航能力 是 机器人移动操作所需要 的 基础能力之一,是扩展机器人工作范围和应用场景的关键因素。然而目前的导航任务往往是为特定任 务和特定机器人而设计的。 这种对导航任务和机器人的划分使得大量研究精力投入到利用任务和机器人设计的先验上,这种做法忽视了跨任务和跨本体导航的能力共性 (synergy),极大的限制了导航能力在算法层面上的可扩展性。 为此,北京大学,银河通用,阿德莱德大学,浙江大学等机构合作,探究如何构建具身导航的基座模型(Embodied Navigation Foundation Model)提出了NavFoM,一个跨任务和跨载体的导航大模型。实现具身导航从"专用"到"通用"的技术跃进,真正做到: 为了实现这种范式,我们可以把不同的导航任务的目标用文本指令描述,并且统一用视频流来表达导航历史,用自然语言描述不同任务的导航 目标,并让模型预测未来的运动轨迹。因此,我们可以用一个统一的架构构建NavFoM: 多任务 :视觉语言导航,目标搜索,目标跟随,自驾等; 全场景 :室内、室外等不同场景; 跨本体 :四足,轮式,人形,无人机和汽车等。 Nav ...