Workflow
仿真到现实
icon
搜索文档
OpenAI回归机器人:想把大模型推向物理世界
36氪· 2025-09-17 19:12
公司战略调整 - OpenAI将研究与招聘资源重新投向具身智能领域 重点推进人形机器人系统研发[1] - 公司重建并扩编机器人团队 采用遥操作与仿真驱动的数据训练闭环[3][9] - 前Meta AR硬件负责人Caitlin Kalinowski加入 负责机器人与消费硬件方向[4] 技术路径规划 - 通过遥操作与Nvidia Isaac等仿真工具收集多样交互数据 构建动作生成控制策略[3][8] - 采用大规模强化学习与GPU管线优化技术 实现感知-控制的时序与稳定性[3][8] - 探索传感器 执行器 计算元件集成 面向真实约束进行形态设计[3][8] 产品开发进展 - 机械产品工程师岗位要求为高产量100万台以上设计机械系统的经验[3] - 公司专注于解锁通用机器人 强调可规模化制造的前置设计[3] - 是否自建硬件或与外部制造商合作仍未明朗[3][9] 行业发展背景 - 人形机器人赛道自2024年以来资本流入超过50亿美元[9] - 特斯拉 谷歌 Agility等企业均在推进原型验证与小规模商用[9] - 机构对2050年万亿美元级市场规模展望持续强化[9] 历史技术积累 - 公司2019年Dactyl五指机械手实现单手复原魔方 展示仿真到现实的突破[6] - 曾采用ADR自动域随机化等方法 2021年关闭团队转向通用模型研发[6] - 当前回归是为实现技术与物理世界更深层耦合的必经之路[6]
手把手教机器人:斯坦福大学提出RTR框架,让机械臂助力人形机器人真机训练
机器之心· 2025-08-27 08:46
核心观点 - 人形机器人运动控制领域正成为强化学习算法应用的热点 采用仿真到现实范式训练通用控制模型 但该方案牺牲了特定真实环境中的性能上限[2] - 提出创新的RTR系统 使用教师机械臂在现实世界指导学生人形机器人进行在线强化学习 突破真机训练障碍[4][6] - RTR系统通过硬件协同和算法创新实现三阶段高效微调 在行走和荡秋千任务中展现卓越性能 仅需20分钟真实训练即可将仿真预训练速度提升一倍[6][15][19] 技术方案 - 硬件系统由教师UR5六轴机械臂与学生ToddlerBot人形机器人组成 通过四根弹性缆绳柔性连接 配备力传感器和可编程跑步机[8] - 教师机械臂扮演多重角色:安全保护装置 自动重置帮手 训练数据信号源 以及通过课程学习设置进度和施加扰动的智慧教练[5] - 算法采用三阶段Sim-to-Real流程:先在仿真环境训练适应不同物理参数的策略 再优化通用初始隐变量 最后在真实世界仅在线优化低维隐变量z[9][10][11] 性能表现 - 在行走任务中 主动顺应机器人运动的柔性机械臂比固定吊架显著提升学习效果 课程学习策略优于固定辅助策略[15] - 微调隐变量方法在数据效率和最终性能上均优于微调整个策略网络或残差网络基线 真机微调效果强于RMA等在线参数识别基准[6][18] - 在纯真实环境荡秋千任务中 有教师主动参与的课程学习效率高于固定吊架方案 20分钟内学会幅度明显的周期性摆荡动作[19] 应用前景 - RTR框架为解决当前人形机器人真机部署与训练瓶颈提供可行方案 引入主动力辅助新范式[17] - 该框架具有高度扩展性 可通过更强工业机械臂或力传感龙门吊系统推广至全尺寸人形机器人及其他复杂机器人系统[17] - 项目代码已全部开放 被CoRL 2025会议接收 由清华大学和斯坦福大学研究人员共同完成[22]