公司技术与产品发布 - 美国具身智能创业公司Physical Intelligence发布最新机器人基础模型π0.6 [1] - 公司技术路线强调“视觉-语言-动作”模型,通过大规模数据训练使机器人具备泛化能力,能在未知环境中灵活执行任务 [1] - 搭载π0.6模型的机器人已可在办公室内为人们制作拿铁、美式和意式咖啡 [3] - 通过对模型进行微调,其在除处理衣物外的多种任务上成功率可达90%,任务处理效率大幅提升 [3] 核心技术创新:Recap方法 - 公司开发名为Recap的方法,实现了通过演示训练、通过纠错指导、以及从自主经验中改进这三个学习步骤 [5] - Recap结合了纠正式指导和强化学习,能从“质量较差”的经验数据中获得良好的训练信号 [8] - 该方法通过训练价值函数解决强化学习中的信用分配关键挑战,使模型能理解哪些动作导致好或坏的结果 [11][13] - 使用Recap训练π0.6模型可将最困难任务的吞吐量提高一倍以上,并将失败率降低2倍或更多 [5] 模型性能与应用场景 - π0.6模型基于π(0.6)模型训练,采用稍大的骨干网络,能处理更异质化的提示与条件信息 [14] - 模型在三个真实世界应用场景中表现优异:制作意式咖啡饮品、折叠多种类型衣物、组装包装用纸盒 [16][21] - 对于制作意式咖啡等最困难任务,结合机器人真实执行经验后,模型的吞吐量和成功率均提升了超过两倍 [17] - π*0.6能够以超过90%的成功率完成涉及复杂物理操作和长序列步骤的挑战性任务 [22] 行业影响与未来方向 - 像Recap这样的方法能解决当前机器人基础模型对人为收集示范数据的严重依赖限制 [23] - 随着机器人在真实世界中广泛部署,从经验中学习可能成为实现高性能模型不可或缺的组成部分 [24] - 未来,专家示范用于定义新行为,纠正式指导用于改进策略,而自主经验则可能成为规模最大的数据来源,用于打磨行为并最终可能超越人类表现 [24] 公司背景与市场地位 - Physical Intelligence是一家总部位于旧金山的机器人与AI创业公司,使命是将通用人工智能从数字世界带入物理世界 [1] - 公司在2024年获得超过4亿美元融资,估值突破20亿美元,成为具身智能赛道最受瞩目的玩家之一 [1]
真机RL,最强VLA模型π*0.6来了,机器人在办公室开起咖啡厅