Workflow
机器人“干中学”,人类不用再给工厂中的机器人当保姆

技术应用与突破 - 智元机器人团队研发的真机强化学习技术已在与龙旗科技合作的验证产线中落地 [1] - 强化学习是一种让机器人通过不断尝试和反馈自主优化动作策略的AI训练方式 [1] - 传统强化学习通常在仿真环境中完成,但仿真到真实环境之间存在沟壑,虚拟策略需大量调试才能在真机稳定复现 [1] - 真机强化学习直接嵌入真实产线,使产线作业的通过率、作业节拍、良率直接成为机器人优化目标 [3] - 机器人可通过产线的原生信号完成训练,部署时间可缩减至分钟级 [3] 行业现状与挑战 - 人形机器人企业进入实际场景时,常需耗时数月进行部署和调试 [2] - 在工厂实际产线中,仅有两三台机器人作业,但负责调试与维护的工作人员达数十人 [2] - 为人形机器人配备10位工作人员进行调试、标定与安全监控被视为常态 [2] - 真机强化学习部署过程中可能存在物料损耗或安全风险,需通过预训练和底层控制将风险控制在可控范围内 [3] - 该技术不仅依赖算法本身,更依赖于与工厂系统在通信技术、数据接口等方面的深度对接 [3] 未来发展路径 - 团队正通过本地私有云与OTA机制,实现不同工序的真机强化学习经验共享,以解决批量复制难题 [3] - 此方法旨在实现模型的批量更新和复现 [3] - 需在实际环境中逐步打通底层环节,以确保工序间的数据流和反馈闭环真正形成 [3]