Workflow
LWD(Learning While Deploying)
icon
搜索文档
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
机器之心· 2026-04-30 12:52
编辑|泽南 这一次,具身智能的范式算是彻底升级了。 智元机器人的办公室里,最近员工们一上班就能看到机器人熟练地切着水果: 有梨有黄瓜,一通操作完了之后装进破壁机,打成了健康饮料端上来: 同样一套设备也能玩转调酒的全套流程: 或是做工夫茶、整理商品货架、打包鞋盒等各种任务: 之前每台机器人只能完成一个任务,现在基于同一个模型的机器人可以承接大量不同任务。而且,在真实世界中持续部署的过程中,它们的性能还会持续不 断地提升。 这么全面的能力是如何做到的?答案是直接在真实环境中搞大规模分布式强化学习训练。它们使用的是全新的具身智能训练范式: 面向通用机器人策略的分布式 多机强化学习(LWD) 。这一套技术捅破了当前VLA的「天花板」。 LWD 启动物理世界的飞轮 最近一段时间,VLA(视觉 - 语言 - 动作)大模型出现,通过端到端的训练范式让机器人具备了通用泛化能力:只需要收集图像数据,读取人类自然语言 指令,大模型就能将视觉和语言转化为空间特征,直接输出机械臂各个关节的角度和速度,进而完成任务。 但在物理世界里,VLA 具身智能的表现仍然算不上可靠。在长程任务和复杂条件上,机器人频频翻车。工程师往往只能将失败的案 ...