Workflow
VLA模型π0.5
icon
搜索文档
估值超170亿元,头部具身智能大模型创企发布最新VLA模型!家庭服务机器人,要来了!
Robot猎场备忘录· 2025-05-03 15:00
文章核心观点 - 具身智能大模型初创公司Physical Intelligence(PI)发布最新视觉-语言-动作(VLA)大模型π0.5,该模型具备开放世界泛化能力,能在陌生家庭环境中执行复杂家务任务[1][2] - π0.5采用异构数据协同训练和双系统架构技术,实现高层次语义推理与低层次动作执行的统一,标志着机器人技术从实验室走向现实世界的突破[5][8][10] - 2025年双系统架构VLA模型成为行业主流,国内外头部公司如Figure AI、英伟达、智平方等均推出类似技术路径产品[14][15] - PI公司成立仅一年估值达24亿美元,拥有全球顶尖创始团队,获贝索斯、OpenAI等机构投资,技术合作覆盖星尘智能、智元机器人等企业[16][17][18] 技术突破 - **开放世界泛化能力**:π0.5在训练数据未覆盖的家庭场景中实现功能迁移,如在不同厨房/卧室完成清洁、整理等长周期任务,依赖物理操作与语义推理的多层次认知[2][5] - **协同训练原理**:整合多模态数据(400小时机器人操作数据+人类语言指导),通过消融实验验证数据组合效果,使模型同时掌握动作执行与任务语义理解[5][7][8] - **双系统架构创新**:采用高层VLM(慢脑推理)与底层VLA(快脑执行)分层设计,类似人类"思维链"模式,解决传统端到端VLA模型长期规划能力不足的问题[8][10][15] 行业动态 - **技术路径趋势**:双系统架构成为2025年具身智能领域标准方案,典型案例包括Figure AI的Helix模型(2025年2月)、英伟达GR00T N1(2025年3月)、智平方Alpha Brain(2025年4月)[14] - **商业化进展**:科技大厂加速入局,谷歌/OpenAI/Meta转向本体制造,国内华为/京东跟进;资本聚焦具身智能创企如自变量机器人、穹彻智能等[21][22] - **核心壁垒**:软件算法超越硬件成为人形机器人商业化关键,企业需自研大模型构建技术闭环,仅依赖第三方模型难以形成竞争力[20][26] 公司背景 - **创始团队**:集结UC Berkeley/斯坦福教授与谷歌科学家,包括Sergey Levine(RT-X项目负责人)、Chelsea Finn(ALOHA项目导师)等,团队论文引用超4.7万次[16][19] - **融资历程**:2024年3月成立即获7000万美元融资(投后估值4亿),11月完成4亿美元新一轮融资(投后估值24亿),领投方含贝索斯、Thrive Capital[17] - **技术合作**:π0模型已应用于星尘智能Astribot S1机器人,2025年4月与智元机器人达成动态环境复杂任务合作,由BAIR博士后罗剑岚推进[18]