Google推出Gemini Robotics 1.5,如何让机器人更聪明、更安全、更通用?
为什么智能机器人无法在复杂场景中工作,为什么当下的智能机器人还无法完成多步骤任务? 我们正推动实体智能体时代的发展——让机器人能够感知、规划、思考、使用工具并采取行动,从 而更好地解决复杂的多步骤任务。 今年早些时候,我们以Gemini Robotics系列模型为起点,在将Gemini的多模态理解能力引入物理 世界方面取得了重大进展。 如今,我们在推进智能型、真正通用型机器人的道路上又迈出了一步。我们推出两款具备高级思考 能力的模型,可解锁智能体体验: Google DeepMind推出的Gemini Robotics 1.5与Gemini Robotics-ER 1.5,恰好以底层技术 创新视角填补了这一空白。 作为构建下一代Physical Agents的核心引擎,这两款模型形成"推理 大脑+执行中枢"的黄金组合: ER 1.5作为性能最优的VLM模型,在15项实体推理学术基准测试中斩获综合第一,能通过自然语 言理解复杂需求,原生调用谷歌搜索获取外部信息(如当地垃圾分类规则),制定多步骤计划并估 算任务成功率,更支持"思考预算"自定义以平衡延迟与精度。 Robotics 1.5则作为顶尖VLA模型,凭借" ...