双系统架构

搜索文档
顶级专家带队,这家创企宣布万台人形机器人量产计划!
Robot猎场备忘录· 2025-05-15 14:35
核心观点 - 智平方发布全栈自研全域全身具身智能大模型Alpha Brain和新一代仿生机器人AlphaBot 2,具备从桌面到开放环境、从单臂到全身、从简单到长程任务的能力 [1][3] - Alpha Brain采用GOVLA架构,整合空间交互基础模型、慢系统(System2)和快系统(System1),实现复杂逻辑推理与实时动作控制 [5] - 公司首次将DeepSeek技术融入VLA大模型,提升长程复杂任务理解能力,并与优必选科技等企业共同推动双系统架构VLA模型成为行业主流 [5][8] - AlphaBot 2搭载Alpha Brain,具备34+全身自由度、0-240cm垂直工作范围和6h+续航能力,适配汽车制造、半导体等多场景任务 [7][8] 技术架构 - GOVLA大模型由空间交互基础模型、慢系统(System2)和快系统(System1)组成,慢系统负责复杂逻辑与任务拆解,快系统控制实时动作 [5] - 双系统架构技术路径将VLA拆分为VLM和动作执行模型,解决传统VLA数据采集难和长期规划问题,提升复杂场景适应性 [13] - 智平方是国内最早研发端到端VLA模型的企业,其RoboMamba模型在未见任务泛化能力上超越Google RT系列模型 [14] 商业化进展 - 公司已签约多家车企和高端制造企业,2024年实现数千万收入,并提供AI2R Brain MaaS订阅服务,计划按"智能操作工时"收费 [20] - 与吉利科技晶能微电子合作研发半导体制造机器人,与华熙生物开发生物科技领域智能解决方案 [24] - 目标2028年实现万台应用,2030年达成百亿级营收,2033年拓展至百万台规模 [20] 融资与行业动态 - 2025年完成Pre-A+轮数亿元融资,投资方包括敦鸿资产、云启资本等,此前Pre-A轮由达晨财智领投 [25] - 具身智能赛道吸引车企和自动驾驶领域人才创业,它石智航等公司完成亿级融资,行业进入融资热潮 [22][23] - 行业共识认为全栈自研是核心竞争力,智平方等具备AI+本体能力的企业更受资本青睐 [26][27] 创始团队背景 - 创始人郭彦东为国家级创新领军专家,曾任小鹏汽车首席科学家和OPPO首席科学家,具备AI与硬件复合背景 [17] - 副总裁邱巍拥有清华大学和德国高校背景,曾在西门子工作13年,后加入驭势科技任高管 [17] - 核心团队来自微软、小鹏、OPPO及清华、北大等顶尖高校,覆盖AI、机器人、智能终端领域 [18]
估值超170亿元,头部具身智能大模型创企发布最新VLA模型!家庭服务机器人,要来了!
Robot猎场备忘录· 2025-05-03 15:00
文章核心观点 - 具身智能大模型初创公司Physical Intelligence(PI)发布最新视觉-语言-动作(VLA)大模型π0.5,该模型具备开放世界泛化能力,能在陌生家庭环境中执行复杂家务任务[1][2] - π0.5采用异构数据协同训练和双系统架构技术,实现高层次语义推理与低层次动作执行的统一,标志着机器人技术从实验室走向现实世界的突破[5][8][10] - 2025年双系统架构VLA模型成为行业主流,国内外头部公司如Figure AI、英伟达、智平方等均推出类似技术路径产品[14][15] - PI公司成立仅一年估值达24亿美元,拥有全球顶尖创始团队,获贝索斯、OpenAI等机构投资,技术合作覆盖星尘智能、智元机器人等企业[16][17][18] 技术突破 - **开放世界泛化能力**:π0.5在训练数据未覆盖的家庭场景中实现功能迁移,如在不同厨房/卧室完成清洁、整理等长周期任务,依赖物理操作与语义推理的多层次认知[2][5] - **协同训练原理**:整合多模态数据(400小时机器人操作数据+人类语言指导),通过消融实验验证数据组合效果,使模型同时掌握动作执行与任务语义理解[5][7][8] - **双系统架构创新**:采用高层VLM(慢脑推理)与底层VLA(快脑执行)分层设计,类似人类"思维链"模式,解决传统端到端VLA模型长期规划能力不足的问题[8][10][15] 行业动态 - **技术路径趋势**:双系统架构成为2025年具身智能领域标准方案,典型案例包括Figure AI的Helix模型(2025年2月)、英伟达GR00T N1(2025年3月)、智平方Alpha Brain(2025年4月)[14] - **商业化进展**:科技大厂加速入局,谷歌/OpenAI/Meta转向本体制造,国内华为/京东跟进;资本聚焦具身智能创企如自变量机器人、穹彻智能等[21][22] - **核心壁垒**:软件算法超越硬件成为人形机器人商业化关键,企业需自研大模型构建技术闭环,仅依赖第三方模型难以形成竞争力[20][26] 公司背景 - **创始团队**:集结UC Berkeley/斯坦福教授与谷歌科学家,包括Sergey Levine(RT-X项目负责人)、Chelsea Finn(ALOHA项目导师)等,团队论文引用超4.7万次[16][19] - **融资历程**:2024年3月成立即获7000万美元融资(投后估值4亿),11月完成4亿美元新一轮融资(投后估值24亿),领投方含贝索斯、Thrive Capital[17] - **技术合作**:π0模型已应用于星尘智能Astribot S1机器人,2025年4月与智元机器人达成动态环境复杂任务合作,由BAIR博士后罗剑岚推进[18]
你的机器人“牌搭子”,来了!北京人形创企发布最强分层端到端VLA模型!
Robot猎场备忘录· 2025-04-29 00:58
灵初智能技术突破 - 公司发布全球首个支持"动作感知-环境反馈-动态决策"全闭环的VLA模型Psi-R1,采用分层端到端架构结合强化学习算法,攻克开放场景下的长程复杂任务挑战[3] - Psi-R1模型在麻将场景中展示30分钟+持续CoAT超长任务时长能力,实现100%准确翻牌、自主构建碰杠策略链、多体协同看牌及动态算牌等灵巧操作[3][4][6][9] - 模型采用"快慢脑"分层架构(快脑S1专注操作/慢脑S2专注推理),突破传统VLA单向决策局限,首次实现视觉-语言-动作多模态协同的CoAT思维链[11] - 同步发布16自由度灵巧手PsiBot H1和双臂轮式机器人PsiBot V1,形成完整技术闭环[17] 行业技术趋势 - 2025年双系统架构VLA模型成为行业主流,Figure AI/Physical Intelligence/英伟达/智平方等国内外企业均推出类似架构产品[14][15] - VLA模型通过拆分VLM与动作执行模块,解决数据采集难和长程规划问题,使机器人能应对复杂长跨度任务[17] - 行业技术路径从纯模仿学习转向结合互联网视频学习人类技巧,显著提升泛化能力[17] 公司发展历程 - 2024年12月发布首款强化学习端到端模型Psi R0,实现Pick&Place长程泛化;2025年3月升级至Psi R0.5,仅需2小时数据即可完成场景泛化[19] - 采用强化学习复合路线攻克"高泛化性-高鲁棒性-高泛化性"不可达三角,目标实现超越人类的灵巧操作[21] - 成立两个月即获高瓴创投/蓝驰创投天使轮融资,智元机器人参与投资[21] 团队与产学研合作 - 创始团队由70-00后跨年龄梯度组成,含产品老兵和科学家密度最高的组合,CEO王启斌博士拥有20年机器人商业化经验[21] - 与北京大学成立联合实验室,由强化学习专家杨耀东博士担任首席科学家,合作开发多模态版DeepSeek-R1模型[22] - 可能成为国内最先受益于DeepSeek开源红利的公司,已基于Align-DS-V开展VLA深度探索[22] 商业化布局 - 当前聚焦双手双臂轮式机器人操作能力,暂不涉及双足机器人[22] - 已与制造业/商超零售/跨境物流龙头企业合作,规划从泛工业→泛零售物流→家庭应用的梯次落地路径[22] 行业竞争格局 - 全球超200家企业布局具身智能,灵初智能属于同时涉足大模型和机器人本体的典型代表,同类企业包括智平方/它石智航/星海图等[23] - 软件算法进步成为推动人形机器人场景拓展的关键,自研大模型构建技术闭环是企业的核心竞争壁垒[23] - 多数人形机器人初创公司AI投入不足,依赖科技大厂赋能,但科技巨头可能亲自下场造人形成终局竞争[24][25]