Workflow
低成本6DOF机械臂
icon
搜索文档
仅需300美元!先进VLA模型与低成本硬件相结合
具身智能之心· 2025-11-11 08:02
文章核心观点 - 研究团队开发出低成本视觉-语言-动作系统,通过约311.98美元的6自由度机械臂与自适应视野集成器,在真实场景中实现超越现有方法的性能,推动机器人基础模型普及 [1] 关键创新 - 采用双动作头设计,联合训练离散自回归动作头和连续L1回归动作头,离散动作擅长高层语义推理,连续动作保障精细操作精度 [6] - 损失函数通过加权求和平衡交叉熵损失与L1损失,优化离散与连续动作 [6] - 自适应重规划机制通过计算两种动作预测的平均绝对差估计不确定性,差异超阈值时触发重规划,动态调整动作执行长度 [3] - 自适应视野集成器在空间任务中成功率96.8%,比次优集成器高出1.6%,避免传统集成器过度平滑动作流问题 [12][13] 低成本6DOF机械臂设计 - 核心参数包括成本约311.98美元,6个自由度,有效负载0.2kg,工作半径382mm,最大速度0.7m/s,重复定位精度≤10mm [5] - 硬件选型采用MG996R、DS3225等市售舵机,关节配置为roll-pitch-pitch-roll-pitch-roll,手腕3个舵机构成类球关节实现全姿态覆盖 [10] - 控制方案使用Arduino Uno搭配PCA9685 12位PWM驱动板,通过I2C通信实现精准控制,降低软件依赖,支持跨操作系统使用 [10] 自动化数据集与数据收集流程 - 数据集规模包含1200个任务演示样本,每个样本配对自然语言指令、RGB图像序列和末端执行器姿态数据 [10] - 任务覆盖拾取放置、环境操作(如开关抽屉)、堆叠等,通过参数化轨迹基元和通用语言模板快速生成多样化训练样本 [10] 实验结果与核心表现 - 在LIBERO仿真基准的空间、物体、目标、长时四大任务套件中,平均成功率达91.4%,仅落后最优基线3.9% [9][11] - 空间任务套件成功率96.8%,超越所有基线 [9][11] - 推理效率达54.2–108.4Hz,延迟仅0.0738秒,接近OpenVLA-OFT性能,额外开销仅来自自适应视野模块 [11][12] - 真实世界测试中,分布内任务平均成功率比现有方法高出49% [14] - 分布外任务在未见过的任务、环境及静态/动态干扰下,平均性能提升34.9%,动态干扰下性能仅下降10%,静态干扰下下降20% [16][17] 行业价值与影响 - 通过"低成本硬件+高效模型+开源数据集"组合打破VLA技术准入门槛,使家庭用户和小型研究团队能够接触机器人基础模型 [18] - 真实场景中的强泛化性和可靠性为家庭服务、教育科研等领域普及奠定基础 [18]