文章核心观点 - 人工智能正以前所未有的速度从"会说"迈向"会做",具身智能成为连接认知与行动的关键前沿,机器人操作在其中扮演核心角色[5] - 该综述论文使用17张图、15张表格、超1000篇参考文献,系统梳理了机器人操作领域的全景图谱,提出了统一的理解框架[6] - 论文扩展了传统的"高层规划—低层控制"划分,高层规划纳入语言、代码、运动、可供性与三维表示,低层学习控制提出基于训练范式的新分类法[9][11] 机器人操作研究演进 - 从早期的规则控制与运动规划,发展到如今融合强化学习、模仿学习与大模型的智能控制体系,经历范式转变[6] - 控制范式从基于经典算法(如RRT、MPC)演进到基于学习的方法(如强化学习/模仿学习)[15] - 硬件沿革从机械手、机械臂发展到移动机器人平台[15] 研究框架与分类体系 - 提出统一的高低层控制框架:高层规划涵盖任务规划、语言、代码、运动、可供性和3D表示[14][21] - 低层学习控制采用三层结构分类:输入建模、潜表征学习和策略学习[22][24] - 系统总结了机器人操作面临的两大核心瓶颈:数据采集与利用、系统泛化能力[27] 数据集与仿真平台 - 梳理了多种仿真器与基准,包括MetaWorld、Franka Kitchen、RLBench等平台,支持50-1000+任务数量[16] - 数据集类型涵盖抓取数据集、轨迹数据集、具身问答与功能可供性数据集等[16] - 例如CALVIN数据集包含40M演示,Maniskill2包含2144物体和20任务[16] 操作任务分类 - 将操作任务分为抓取、基础操作、灵巧操作、软体机器人操作、可变形物体操作、移动操作、四足机器人操作和人形机器人操作等8类[17][19] - 各任务类型有明确技术定义,如抓取狭义定义为机器人生成抓取位姿,灵巧操作通过多指手实现精确物体控制[17] - 基础操作指单臂或双臂在桌面场景执行的简单任务(如拾放、分拣)[17] 未来研究方向 - 构建真正的"机器人脑",实现通用认知与控制[35] - 打破数据瓶颈,实现可扩展的数据生成与利用[35] - 强化多模态感知,提升与复杂物体的交互能力[35] - 确保人机共存安全,推动机器人走向真实世界[35]
史上最全robot manipulation综述,多达1200篇!八家机构联合发布
自动驾驶之心·2025-10-15 07:33