Workflow
商用服务机器人
icon
搜索文档
具身领域的目标导航到底是什么?主流算法盘点~
自动驾驶之心· 2025-07-04 18:27
目标驱动导航技术概述 - 具身导航涉及语言理解、环境感知、路径规划三大技术支柱,目标驱动导航是其最具代表性的方向,要求智能体在陌生环境中仅凭目标描述自主完成探索与路径规划 [1] - 与传统视觉语言导航不同,目标驱动导航需实现从"听懂指令走对路"到"看懂世界自己找路"的跃迁,涉及语义解析、环境建模与动态决策的交叉突破 [1] 产业化落地现状 - 终端配送场景中,美团无人配送车通过动态路径重规划执行任务,Starship Technologies的园区配送机器人已在欧美高校和社区部署 [2] - 医疗、酒店及餐饮场景中,嘉楠科技、云迹科技、擎朗智能的商用服务机器人以及美国Aethon公司的TUG系列实现药品、文件和餐食的自主配送 [2] - 人形机器人领域,宇树科技Unitree系列通过Habitat预训练完成导航任务,智元机器人集成目标驱动导航模块,特斯拉Optimus展示端到端操作能力 [2] 技术演进与生态发展 - 基于Habitat仿真的具身导航生态自2020年CVPR提出点导航基准以来,逐步扩展至图像导航、目标导航及移动抓取任务,形成闭环评测体系 [3] - 视觉预训练模型提升特征泛化能力,分布式强化学习框架使PointNav任务SPL指标显著提升,大语言模型解决部分开放词汇导航难题 [3] - 当前技术进展呈现梯度:PointNav和闭集ObjectNav接近人类表现,开放词汇物体导航和动态障碍物场景仍面临挑战 [3] 三代技术路线迭代 - 第一代端到端方法基于强化学习与模仿学习框架,在点导航与闭集图片导航任务中取得突破,SPL指标逼近人类表现 [4] - 第二代模块化方法通过显式构建语义地图,在零样本目标导航任务中展现优势,未见物体场景下成功率提升明显 [4] - 第三代LLM/VLM融合方法引入大语言模型的知识推理能力,提升开放词汇目标匹配精度,当前研究重点在于设计场景表征接口 [6] 技术挑战与学习痛点 - 目标驱动导航需掌握自然语言处理、计算机视觉、强化学习和场景图相关知识,学习路径碎片化且论文数量繁多 [8] - 缺乏系统实战指导和高质量文档,Habitat生态的导航研究入门难度较高 [8] 课程特点与大纲 - 课程基于Just-in-Time Learning理念,帮助学员快速掌握核心技术栈并构建领域框架 [9][10] - 课程涵盖目标驱动导航理论基础、Habitat仿真生态解析、三代技术方法论及实战环节,最终聚焦VLFM算法复现与真实场景部署 [14][15][16][17][18] - 课程进度安排为3个月,覆盖端到端方法、模块化架构及LLM/VLM驱动系统的理论与实践 [24][25] 目标学员与预期成果 - 目标学员包括机器人抓取领域从业人员、具身智能研究者、传统CV或自动驾驶转行者等,需具备Python和PyTorch基础 [23] - 预期成果包括掌握主流框架复现能力、零样本导航技术落地、Sim2Real部署流程理解及独立开展算法改进的能力 [25]
传统导航和具身目标导航到底有啥区别?
具身智能之心· 2025-07-04 17:48
机器人导航技术演变 - 技术路线从传统建图定位导航向基于大模型方案演变,分为视觉语言导航(VLN)和目标导航两类 [1] - VLN核心是"听懂指令走对路",目标导航核心是"看懂世界自己找路" [1][6] 视觉语言导航(VLN)技术架构 - 任务包含理解语言指令、感知环境、规划运动策略三方面,系统由视觉语言编码器、环境历史表征、动作策略模块构成 [2] - 主流采用预训练视觉语言模型和LLM进行指令拆解,编码器设计需解决多模态表征空间投影问题 [2] - 序列决策通过隐式端到端(隐变量)或显式端到端(拓扑图/BEV语义地图)方法实现环境建模 [2] - 策略学习从标注数据转向LLM知识蒸馏,数据增强是关键 [3] 目标导航技术突破 - 需在陌生环境中仅凭目标描述自主完成探索与路径规划,涉及语义解析、环境建模、动态决策 [4][6] - 需整合计算机视觉、强化学习与3D语义理解技术,实现从被动执行到主动决策的跃迁 [6] 商业应用现状 - 美团无人配送车、Starship Technologies园区机器人实现动态环境配送 [8] - 嘉楠科技、云迹科技、擎朗智能的医疗/酒店机器人完成药品/餐食自主配送 [8] - 人形机器人领域:宇树科技Unitree系列、智元工业机器人、特斯拉Optimus集成目标导航模块 [8][9] - 导航技术岗位需求旺盛,部分公司开出七位数年薪 [9] 技术学习挑战 - 需掌握自然语言处理、计算机视觉、强化学习、图神经网络等多领域知识 [10] - 知识碎片化且论文数量庞大,跨领域学习路径困难 [10] 专业课程内容 - VLN课程覆盖仿真环境、端到端方法、数据增强策略及实战,培养1年从业经验 [13][15][16] - 目标导航课程包含Habitat仿真、LLM/VLM驱动系统、Sim2Real部署等,实现零样本导航能力 [16][17]
今年大火的目标导航到底是什么?从目标搜索到触达有哪些路线?
具身智能之心· 2025-06-26 22:19
目标驱动导航,赋予机器人自主完成导航目标 具身导航作为具身智能的核心领域,涉及语言理解、环境感知、路径规划三大技术支柱。目标驱动导航(Goal-Oriented Navigation)通过赋予机器人自主决策能 力,是具身导航中最具代表性的方向。 目标驱动导航要求智能体在陌生的三维环境中,仅凭目标描述(如坐标、图片、自然语言)等,即可自主完成环境探索与 路径规划。 与传统视觉语言导航(VLN)依赖显式指令不同,目标驱动导航系统需要实现从"听懂指令走对路"到"看懂世界自己找路"的跃迁:当人类下达"去厨房拿可乐"的指 令时,机器人需自主完成语义解析(识别厨房空间特征与可乐视觉属性)、环境建模(构建家居场景的空间拓扑)以及动态决策(避开移动的人类或宠物),这 背后凝聚着计算机视觉、强化学习与3D语义理解的交叉突破。 目标驱动导航技术已在多个垂直领域实现产业化落地。在终端配送场景中,该技术与社交导航算法结合,使机器人具备应对动态环境和人际交互的能力:美团无 人配送车通过动态路径重规划在复杂城市环境中执行递送任务,Starship Technologies的园区配送机器人已在欧美高校和社区部署。在医疗、酒店及餐饮场景,嘉 ...
广交会观察:从“中国第一展”看外贸发展“三新”动能
中国新闻网· 2025-05-06 00:01
中新社广州5月5日电题:广交会观察:从"中国第一展"看外贸发展"三新"动能 中新社记者蔡敏婕 广交会上,新品首发亦组成矩阵,以新产品、新技术、新工艺、新材料等优势出圈。 山东数字人科技股份有限公司带来高清数字人虚拟解剖台、数字人解剖系统等产品,以创新技术为医学 教育注入新动能;广河县吉明鞋业有限公司的"3D足部扫描技术"宛如给鞋子装了"智能大脑",让鞋楦精 准贴合脚型,在智能生产设备与数字化管理系统加持下,公司出口额逐年攀升。 中国外贸企业正以新产品、新技术推动外贸结构向高附加值升级。面对外贸新形势,"做好自己的事 情,做好产品不断创新",已经成为许多参展商的共识。 新朋友:多元化市场觅商机 台州市大地灯饰有限公司在广交会二期首日一早便迎来波兰的采购商。"这是新的采购商。"公司总经理 陶沿蓉表示,他们通过强化设计和到海外参加展会等途径积极拓展新兴市场。 山东锐图激光科技有限公司相关负责人马同伟表示,询盘的客户65%来自共建"一带一路"国家,这也是 公司近年来想要开拓的国家和地区。 "想要开拓新的市场、布局多元化市场"是本届广交会中国参展商提及最多的目标,为此,不少展团带领 新兴市场的外商前去工厂参观生产线。 ...
机器人有多火?这家深圳VC一日投三家
投中网· 2025-03-20 14:21
全球机器人产业的规则重构已拉开序幕。 来源丨投中网 当DeepSeek 仅用7天即突破1亿用户,成最快应用里程碑;宇树科技的人形机器人在春晚舞台跳出精准的秧歌舞步,鲜有人预测到中国的人工智能和机 器人产业正在多方合力下将以惊人的节奏书写另一场技术革命。今年全国两会首次将"人工智能+"纳入国家战略行动,具身智能等前沿方向更成为政企 学界热议的焦点,昭示着智能体创新正从技术探索迈入规模化落地新周期。 2025年3月19日,国内领先的投资机构同创伟业同日完成对霞智科技、数字华夏、中科第五纪三家机器人企业的战略投资。此次投资不仅凸显了其对人 工智能与机器人深度融合趋势的前瞻洞察,更是对中国以"核心技术创新+场景化应用"双轮驱动战略的生动注脚:政策红利、市场爆发、技术奇点与资 本赋能形成"四轮共振",推动中国从"机器人应用大国"向"智能体创新强国"跃迁。 聚焦前沿技术 三家企业彰显行业标杆价值 将投中网设为"星标⭐",第一时间收获最新推送 同创伟业此次投资的霞智科技、数字华夏、中科第五纪分别覆盖了商用机器人、仿人表情交互机器人以及具身智能大模型三大赛道,代表了机器人产业 不同细分领域的创新力量。 其中霞智科技作为中兴发 ...