谷歌发布本地具身智能模型!全程无联网执行精细操作,从人形机器人到工业机器人全覆盖
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 机器人终于有了自己的"离线大脑"。 Google DeepMind 团队首个可以完全在机器人本地运行的视觉-语言-动作(VLA)模型 Gemini Robotics On-Device 发布。 这个模型不仅能离线运行,还保持了相当强悍的操作能力,能遵循指令完成各种需要精细操作的任务。 支持从人形机器人到工业双臂机器人的多种机器人本体上部署,响应延迟还低到飞起。 此前3月份发布的Gemini Robotics虽然性能强大,但需要依赖云端计算。而这次的On-Device版本,直接把AI塞进了机器人的"大脑"里,彻 底解决了网络延迟和连接不稳定的老大难问题。 给机器人装上本地大脑 团队把Gemini 2.0的多模态推理能力和真实世界理解能力,全都塞进了这个可以在机器人设备上运行的模型里。 由于模型独立于数据网络运行,它 特别适合对延迟敏感的应用 ,并确保在 网络间歇性或零连接的环境中也能稳定工作 。 评测数据显示,On-Device版本在泛化性能测试中表现亮眼。在视觉泛化、语义理解和行为泛化等多个维度上,虽然比云端版本的Gemini Robotics略有差距,但 ...