模拟训练

搜索文档
cVLA:面向高效相机空间VLA模型的关键位姿预测方法
具身智能之心· 2025-07-06 19:54
本文只做学术分享,如有侵权,联系删文 写在前面 视觉-语言-动作(VLA)模型为复杂机器人操作任务提供了强有力的框架,但训练成本往往很高。研究提出了一种新的VLA方法,利用视觉语言模型(VLMs)在 2D图像上的出色表现,直接推断机器人末端执行器在图像帧坐标中的位姿。与以往输出低级控制指令的VLA模型不同,该模型预测轨迹路标,不仅训练更高效, 还与机器人实体无关。尽管设计轻量,其下一个token预测架构仍能有效学习有意义且可执行的机器人轨迹。此外,还探索了深度图像的潜力、解码策略等推理技 术,以及基于演示的动作生成。模型在模拟数据集上训练,展现出良好的模拟到现实迁移能力,并通过模拟和真实数据结合的评估,证明了在真实机器人系统上 的有效性。 >> 点击进入→ 具身智能之心 技术交流群 点击下方 卡片 ,关注" 具身智能 之心 "公众号 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 作者丨 Max Argus等 编辑丨具身智能之心 1. 引言 视觉-语言-动作(VLA)模型通过融合视觉、语言和交互数据,实现细粒度感知与动作生成,能解决多种任务。但V ...
人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
量子位· 2025-03-26 18:29
白交 发自 凹非寺 量子位 | 公众号 QbitAI 注意看,机器人像人一样从容地走出大门了! 甚至,还有一整支机器人队伍迎面走来。 人形机器人独角兽Figure,再次带来他们的新成果—— 利用强化学习实现自然人形行走 。 跟之前版本的机器人相比,确实更像人了许多,而且步态更加轻盈,速度也更快。 根据官方介绍,主要分成三个部分: 强化学习 :强化学习利用模拟试验和错误,教Figure 02 人形机器人如何像人一样行走。 模拟训练 :通过高保真物理模拟器学习如何像人类一样行走,结果只需几个小时就能模拟出多年的数据。 Sim-to-Real :通过将仿真中的域随机化与机器人上的高频扭矩反馈相结合,模拟训练无需额外调整即可直接转换为真实硬件。 网友们纷纷表示被惊艳到,甚至觉得像是 太空行走 。 有一说一,自从与OpenAI取消合作后,这成果输出确实又快又多。 机器人像人一样自然行走 此次推出的,是经过强化学习训练的端到端神经网络。 具体来看。 首先,利用强化学习技术,在GPU加速物理仿真中对新的行走控制器进行了全面训练,并在几个小时内收集了数年的仿真演示数据。 在模拟器中,数以千计的Figure 02机器人被并行模 ...