推翻VLA“旧世界”,自变量发布全球首个“世界统一模型”!机器人终于有了“新大脑”
机器人大讲堂·2026-04-22 21:00

文章核心观点 自变量机器人公司发布了全新的WALL-B世界统一模型,该模型是对前代产品的彻底重写,旨在解决当前机器人行业“模仿而非理解”的核心瓶颈,通过将视觉、语言、动作等多模态能力在单一网络内融合训练,赋予机器人对物理世界的理解能力、原生本体感以及与环境交互中自我进化的能力,并计划在35天后将搭载该模型的机器人送入真实家庭开始商业化应用[1][7][44] 行业现状与瓶颈 - 当前全球没有机器人能在无遥控情况下独立完成家庭综合整理任务,硬件能力(如双足后空翻、灵巧手写字、毫米级力控)已具备,但智能是主要短板[3][4] - 主流机器人本质是“命令行机器人”或“遥控机器人”,依赖预编程或远程操控,其范式无法应对家庭环境中任务碎片化、条件多变的挑战[6] WALL-B模型的技术突破 - 架构革命:从VLA到WUM:WALL-B采用世界统一模型取代当前主流的视觉-语言-动作三模块分立架构,消除了模块间数据传递导致的信息损耗和延迟,实现了多模态能力的原生融合[8][9][13][14] - 核心能力一:原生多模态与本体感:模型从训练起就同时处理视觉、听觉、触觉、语言、动作数据,实现“多模态进、多模态出”,并具备“原生本体感”,能内在感知自身形体边界,无需持续外部观察[15] - 核心能力二:物理世界“世界观”:模型能感知并预测重力、惯性、摩擦力等物理规律,基于对物理常识的理解实现零样本泛化,无需重新训练即可适应新环境[17][18] - 核心能力三:与世界交互并自我进化:与VLA模型失败即停止不同,WALL-B能在任务失败后调整策略再次尝试,并将成功经验直接更新到模型参数中,实现在真实环境中的自我迭代[19][20][22] 数据战略与竞争壁垒 - 公司区分了“糖水数据”(实验室中干净、可控、量大的数据)和“牛奶数据”(真实家庭中嘈杂、多变、充满随机性的数据),认为后者才是模型适应真实世界的关键[27][28][29] - 为获取“牛奶数据”,公司已进入超过100个志愿者的真实家庭进行模型训练[32] - WUM架构的“与世界交互”能力形成了一个自我强化的数据飞轮:进入真实家庭产生数据→模型进化→能力更强→进入更多家庭,这构成了公司几乎不可复制的护城河[34] 商业化进展与模式 - 落地时间表激进:公司宣布35天后,搭载WALL-B的新一代机器人将入驻首批真实家庭正式“上岗”,当前模型处于“实习生”阶段,仍需远程协助且可能犯错[35][36][37] - 产品优势:机器人具备24小时在岗、无情绪化、且能通过每日工作产生的新数据持续变“聪明”的特点[39][40] - 隐私与商业模式:公司提出了视觉脱敏、透明授权、用途限定等隐私解决方案,商业模式上更接近服务订阅模式,强调长期价值在于机器人不断进化的能力和产生的数据资产,而非单纯售卖硬件[41]

推翻VLA“旧世界”,自变量发布全球首个“世界统一模型”!机器人终于有了“新大脑” - Reportify