Workflow
智元机器人
icon
搜索文档
具身领域的目标导航到底是什么?主流算法盘点~
自动驾驶之心· 2025-07-04 18:27
目标驱动导航技术概述 - 具身导航涉及语言理解、环境感知、路径规划三大技术支柱,目标驱动导航是其最具代表性的方向,要求智能体在陌生环境中仅凭目标描述自主完成探索与路径规划 [1] - 与传统视觉语言导航不同,目标驱动导航需实现从"听懂指令走对路"到"看懂世界自己找路"的跃迁,涉及语义解析、环境建模与动态决策的交叉突破 [1] 产业化落地现状 - 终端配送场景中,美团无人配送车通过动态路径重规划执行任务,Starship Technologies的园区配送机器人已在欧美高校和社区部署 [2] - 医疗、酒店及餐饮场景中,嘉楠科技、云迹科技、擎朗智能的商用服务机器人以及美国Aethon公司的TUG系列实现药品、文件和餐食的自主配送 [2] - 人形机器人领域,宇树科技Unitree系列通过Habitat预训练完成导航任务,智元机器人集成目标驱动导航模块,特斯拉Optimus展示端到端操作能力 [2] 技术演进与生态发展 - 基于Habitat仿真的具身导航生态自2020年CVPR提出点导航基准以来,逐步扩展至图像导航、目标导航及移动抓取任务,形成闭环评测体系 [3] - 视觉预训练模型提升特征泛化能力,分布式强化学习框架使PointNav任务SPL指标显著提升,大语言模型解决部分开放词汇导航难题 [3] - 当前技术进展呈现梯度:PointNav和闭集ObjectNav接近人类表现,开放词汇物体导航和动态障碍物场景仍面临挑战 [3] 三代技术路线迭代 - 第一代端到端方法基于强化学习与模仿学习框架,在点导航与闭集图片导航任务中取得突破,SPL指标逼近人类表现 [4] - 第二代模块化方法通过显式构建语义地图,在零样本目标导航任务中展现优势,未见物体场景下成功率提升明显 [4] - 第三代LLM/VLM融合方法引入大语言模型的知识推理能力,提升开放词汇目标匹配精度,当前研究重点在于设计场景表征接口 [6] 技术挑战与学习痛点 - 目标驱动导航需掌握自然语言处理、计算机视觉、强化学习和场景图相关知识,学习路径碎片化且论文数量繁多 [8] - 缺乏系统实战指导和高质量文档,Habitat生态的导航研究入门难度较高 [8] 课程特点与大纲 - 课程基于Just-in-Time Learning理念,帮助学员快速掌握核心技术栈并构建领域框架 [9][10] - 课程涵盖目标驱动导航理论基础、Habitat仿真生态解析、三代技术方法论及实战环节,最终聚焦VLFM算法复现与真实场景部署 [14][15][16][17][18] - 课程进度安排为3个月,覆盖端到端方法、模块化架构及LLM/VLM驱动系统的理论与实践 [24][25] 目标学员与预期成果 - 目标学员包括机器人抓取领域从业人员、具身智能研究者、传统CV或自动驾驶转行者等,需具备Python和PyTorch基础 [23] - 预期成果包括掌握主流框架复现能力、零样本导航技术落地、Sim2Real部署流程理解及独立开展算法改进的能力 [25]
今年大火的目标导航到底是什么?从目标搜索到触达有哪些路线?
具身智能之心· 2025-06-26 22:19
目标驱动导航,赋予机器人自主完成导航目标 具身导航作为具身智能的核心领域,涉及语言理解、环境感知、路径规划三大技术支柱。目标驱动导航(Goal-Oriented Navigation)通过赋予机器人自主决策能 力,是具身导航中最具代表性的方向。 目标驱动导航要求智能体在陌生的三维环境中,仅凭目标描述(如坐标、图片、自然语言)等,即可自主完成环境探索与 路径规划。 与传统视觉语言导航(VLN)依赖显式指令不同,目标驱动导航系统需要实现从"听懂指令走对路"到"看懂世界自己找路"的跃迁:当人类下达"去厨房拿可乐"的指 令时,机器人需自主完成语义解析(识别厨房空间特征与可乐视觉属性)、环境建模(构建家居场景的空间拓扑)以及动态决策(避开移动的人类或宠物),这 背后凝聚着计算机视觉、强化学习与3D语义理解的交叉突破。 目标驱动导航技术已在多个垂直领域实现产业化落地。在终端配送场景中,该技术与社交导航算法结合,使机器人具备应对动态环境和人际交互的能力:美团无 人配送车通过动态路径重规划在复杂城市环境中执行递送任务,Starship Technologies的园区配送机器人已在欧美高校和社区部署。在医疗、酒店及餐饮场景,嘉 ...
上海加速布局具身智能产业:2025张江具身智能开发者大会暨国际人形机器人技能大赛成功举行
机器人圈· 2025-05-29 20:21
5 月 29 日,以" 具身智能,未来已来 "为主题的 2025 张江具身智能开发者大会暨国际人形机器人技能大赛在上海 浦东张江科学会堂成功举行。作为已连续举办四年的最具影响力的行业盛会之一,本次活动汇聚 200 余家人形机器 人、具身智能及产业链上下游重点企业, 5000 余位行业专家和企业代表及开发者共襄盛举。不同以往,今年活动创 新"峰会 + 大赛 + 展览"三位一体新模式,以"开源、开放、开创"为主旨,聚焦技术落地与生态构建,让具身智能未 来图景加速照进现实生活。 本次活动由上海市经济和信息化委员会、上海市浦东新区人民政府指导,国家地方共建人形机器人创新中心(简 称"国地中心")、上海张江(集团)有限公司(简称"张江集团")主办,上海张江人形机器人有限公司、立德机器人 平台(机器人大讲堂)承办,上海市人工智能行业协会、长三角国家技术创新中心、上海交通大学、上海科技大学、 中国农业银行上海市分行共同支持。 上海市委常委、浦东新区区委书记李政,上海市副市长陈杰,上海市政府副秘书长庄木弟,上海市政府副秘书长、浦 东新区区长吴金城,上海市经济和信息化委员会主任张英,上海市经济和信息化委员会副主任张宏韬,浦东新 ...
开源·开放·开创,2025张江具身智能开发者大会暨国际人形机器人技能大赛即将启幕
机器之心· 2025-05-25 18:02
张江科学城作为具身智能创新高地,依托完善的政策支持、成熟的产业生态与深厚的科研实力,正推动人形机器人产业进入"加速跑"阶段。 国 家 地 方 共 建 人 形 机 器 人 创 新 中 心 ( 以 下 简 称 " 国 地 中 心 " ) 自 落 地 浦 东 张 江 以 来 , 已 发 布 全 球 首 台 全 尺 寸 人 形 机 器 人 公 版 机 " 青 龙 " 、 建 立 OpenLoong人形机器人开源社区,并联合行业头部力量发布了全国首批人形机器人具身智能标准,为行业发展提供了清晰指引。 2024中国人形机器人开发者大会暨第三届张江机器人全球生态峰会现场 5月29日, 2025张江具身智能开发者大会暨国际人形机器人技能大赛 将在张江科学会堂启幕。 本次盛会集"峰会+大赛+展览"于一体,汇聚全球创新力量。峰会邀请200余家人形机器人产业链企业,1000余位院士、行业专家和开发者共同研 讨前沿技术;通过举办1场主论坛、9场开发者论坛,为产业发展搭建全要素对接平台。大赛设置五大赛道,充分展示国际人形机器人技能水平。 展览设置3000平方米展区,集中呈现行业创新成果。 此外,现场将发布《具身智能产业高质量发展若干政 ...
人形机器人,最重要的还是“脑子”
36氪· 2025-05-03 10:17
近年来,人形机器人的关注度明显增加了:主要是因为这个领域渐有爆发之势。黄仁勋在去年的不止一 个场合都说过机器人即将迎来"ChatGPT时刻",NVIDIA眼中在生成式AI之外的下一个爆点就是机器 人。 行业内像ROSCon这样的机器人开发者大会越来越火;宇树科技机器人亮相春晚扭秧歌,特斯拉擎天柱机 器人叠衣服等引发极大关注......这些都让人感觉机器人正在以前所未有的速度发展。然而,4月初的一场 人形机器人马拉松比赛却为火热的机器人浇下来一盆冷水。 01 人形机器人水平低于市场预期 最近,北京亦庄半程马拉松暨人形机器人半程马拉松在南海子公园南门开跑。这是全球首个人形机器人 半程马拉松,20支人形机器人赛队与跑步爱好者一起冲出起跑线,在21.0975公里长的赛道上挑战极 限。 然而,多个网传视频显示,此前被寄予厚望的宇树科技G1人形机器人在跑步过程中摔倒,此后站起继 续比赛。 宇树科技对此发布声明称:"宇树最近完全没有参与任何比赛,主要忙着准备人形机器人的格斗直播。 G1人形机器人,从去年发货开始,已经出售给全球非常多的客户,使用了很久。所以这次马拉松比 赛,也有好几个独立的团队使用我们的机器人。比如我们的客 ...
大厂竞相押注人形机器人,我们距离通用还有多远?
AI科技大本营· 2025-03-27 10:23
这两年,具身智能 的进展让人目不暇接。从特斯拉人形机器人 Optimus 在舞池跳舞 ,到宇树 Unitree H1 机器人在春晚扭 秧歌,再到智元机器人灵犀 X2 骑自 行车......这些场景不断刷新着大众对智能机器人的认知,也展示了它们在现实世界中的 适应能力。但一个耐人寻味的现象是,每次成为焦点的,几乎都是人形机 器人。 为什么"人形"成为关注焦点?这或许可以从科技巨头的布局中找到答案。 今年 1 月,英伟达 CEO 黄仁勋在采访时表示:"通用人形机器人技术将最为实用,因为我们的世界是围绕人类需求建造的。" 他坦言,实现这一目标极具挑战,但随着 Transformer、大型语言模型(LLM)及基础模型的突破,已让通 用机器人迈入可 能实现的阶段。短短两个月后,在 GTC 大会上,他直言 直:"通用机器人时代已经到来。" 与此同时,特斯拉 CEO 埃隆·马斯克也在 CES 2025 上做出过大胆预测:人形机器人将成为"史上最大产品",全球或将需要 300 亿台,远超任何其他产品。 其实从本质上看,具身智能指的是"有身体的智能",其核心在于智能决策与物理世界的深度融合。人形机器人之所以成为当 前最受关注的 ...