Workflow
π*0.6模型
icon
搜索文档
重磅!PI 获42亿融资!估值飙升至392亿
机器人大讲堂· 2025-11-21 12:00
融资与估值 - 公司完成新一轮6亿美元融资,估值飙升至56亿美元 [1] - 本轮融资由Alphabet旗下CapitalG领投,现有投资者Lux Capital、Thrive Capital及杰夫·贝索斯持续加码,新晋投资方Index Ventures与T Rowe Price也参与此轮融资 [1] - 公司自2024年3月成立以来融资进程加速,种子轮融资7000万美元估值4亿美元,A轮融资4亿美元估值跃升至24亿美元,三轮融资累计吸金超10亿美元 [9] 团队构成 - 公司团队堪称全明星阵容,首席执行官兼联合创始人Karol Hausman曾是Google DeepMind资深研究科学家,联合创始人Sergey Levine是强化学习领域领军人物,另一位联合创始人Groom是投资人兼支付巨头Stripe前高管 [1] - 团队还包括来自特斯拉、谷歌DeepMind、X等顶尖科技公司的专家,以及斯坦福大学教授等 [3] 技术方向与模型进展 - 公司聚焦通用家用机器人领域,致力于研发可作为各类机器人大脑的人工智能算法,长期愿景是构建一套通用智能系统以赋能多样化机器人应用场景 [3] - 公司提出以研发通用人工智能模型为解决方案,采用覆盖广、数据小的数据集构建策略,首款模型π-0于2024年10月发布,可实现叠衣服、组装纸盒、操作微波炉等多种复杂任务 [5] - 2025年4月发布π-0.5模型,增强了对全新环境的适应能力,通过异构数据协同训练能理解技能语义上下文并实现跨机器人物理行为迁移 [7] - 2025年11月发布最新机器人基础模型π*0.6,引入RECAP通用训练方法,在制作意式浓缩咖啡、折叠衣物、组装工厂包装纸箱等任务中成功率均超过90% [7] 行业背景与挑战 - 家用机器人面临复杂多变的空间环境,多样化任务对精细化动作控制要求高,现有专用机器人往往难以胜任 [3] - 实现不同功能通常需基于新模型与数据重新训练,增加了开发成本,且训练数据需严格适配机器人物理形态与应用场景,加大了数据准备难度 [3]
真机RL,最强VLA模型π*0.6来了,机器人在办公室开起咖啡厅
36氪· 2025-11-18 12:05
公司技术与产品发布 - 美国具身智能创业公司Physical Intelligence发布最新机器人基础模型π*0.6 [1] - 公司技术路线强调“视觉-语言-动作”模型,通过大规模数据训练使机器人具备泛化能力,能在未知环境中灵活执行任务 [1] - 搭载π*0.6模型的机器人已可在办公室内为人们制作拿铁、美式和意式咖啡 [3] - 通过对模型进行微调,其在除处理衣物外的多种任务上成功率可达90%,任务处理效率大幅提升 [3] 核心技术创新:Recap方法 - 公司开发名为Recap的方法,实现了通过演示训练、通过纠错指导、以及从自主经验中改进这三个学习步骤 [5] - Recap结合了纠正式指导和强化学习,能从“质量较差”的经验数据中获得良好的训练信号 [8] - 该方法通过训练价值函数解决强化学习中的信用分配关键挑战,使模型能理解哪些动作导致好或坏的结果 [11][13] - 使用Recap训练π*0.6模型可将最困难任务的吞吐量提高一倍以上,并将失败率降低2倍或更多 [5] 模型性能与应用场景 - π*0.6模型基于π(0.6)模型训练,采用稍大的骨干网络,能处理更异质化的提示与条件信息 [14] - 模型在三个真实世界应用场景中表现优异:制作意式咖啡饮品、折叠多种类型衣物、组装包装用纸盒 [16][21] - 对于制作意式咖啡等最困难任务,结合机器人真实执行经验后,模型的吞吐量和成功率均提升了超过两倍 [17] - π*0.6能够以超过90%的成功率完成涉及复杂物理操作和长序列步骤的挑战性任务 [22] 行业影响与未来方向 - 像Recap这样的方法能解决当前机器人基础模型对人为收集示范数据的严重依赖限制 [23] - 随着机器人在真实世界中广泛部署,从经验中学习可能成为实现高性能模型不可或缺的组成部分 [24] - 未来,专家示范用于定义新行为,纠正式指导用于改进策略,而自主经验则可能成为规模最大的数据来源,用于打磨行为并最终可能超越人类表现 [24] 公司背景与市场地位 - Physical Intelligence是一家总部位于旧金山的机器人与AI创业公司,使命是将通用人工智能从数字世界带入物理世界 [1] - 公司在2024年获得超过4亿美元融资,估值突破20亿美元,成为具身智能赛道最受瞩目的玩家之一 [1]
真机RL!最强VLA模型π*0.6来了,机器人在办公室开起咖啡厅
机器之心· 2025-11-18 11:30
公司及产品发布 - 美国具身智能创业公司Physical Intelligence发布最新机器人基础模型π*0.6 [2] - 公司2024年获得超过4亿美元融资,估值突破20亿美元,成为具身智能赛道最受瞩目的玩家之一 [3] - 公司技术路线强调“视觉-语言-动作”模型,通过大规模数据训练使机器人能在未知环境中灵活执行任务 [3] 模型性能与能力 - 通过对π*0.6模型进行微调,可在除处理衣物外的多种任务上达到90%成功率 [6] - 模型能够连续运行一整天制作意式浓缩咖啡,或连续数小时不间断地折叠衣物 [9] - 利用Recap方法训练π*0.6可将最困难任务的吞吐量提高一倍以上,并将失败率降低2倍或更多 [9] - 对于制作意式咖啡等最困难任务,加入机器人真实执行经验后,吞吐量和成功率都提升了超过两倍 [27] 核心技术方法:Recap - Recap方法实现了演示训练、纠错指导和从自主经验中改进三个步骤 [9] - 该方法通过训练价值函数解决强化学习中的信用分配关键挑战 [15][20] - 在训练中保留全部数据并将价值变化注释作为输入,使模型选择高优势的动作 [20] - 训练过程包括离线强化学习预训练、任务级微调,并结合专家纠正和自主经验反馈 [25] 具体应用场景挑战 - 纸箱组装任务需执行复杂物理操作并处理如一次抓起多个箱子等边缘情况 [33] - 衣物折叠任务需处理不同衣物种类和材质的多样性,实现泛化 [33] - 意式咖啡制作任务涉及长操作序列,需判断设备状态及完成清洁工作 [33] - π*0.6能够以超过90%的成功率完成这些极具挑战性的步骤 [34] 行业发展趋势 - 从经验中学习可能成为实现高性能机器人模型不可或缺的组成部分 [37] - 未来机器人学习将结合专家示范定义新行为、纠正式指导改进策略、自主经验打磨行为 [37]