文章核心观点 - 公司Sunday通过其全栈技术方案,特别是“技能采集手套”和“技能转换系统”,有效解决了机器人领域的数据瓶颈问题,实现了无需机器人本体数据即可训练高性能模型,其数据转换成功率高达90% [12] - 公司基于上述基础设施训练出的首个基础模型ACT-1,在超长时序任务、零样本环境泛化及灵巧操作等多个前沿领域取得了快速且显著的进展 [5][15][21][26] 公司技术方案与数据策略 - 公司认为机器人行业发展的核心瓶颈是数据,缺乏互联网规模的真实世界操作数据语料库 [6] - 公司提出“具身失配”是数据问题的关键,并致力于使机器人形态与人体一致,以便利用全球80亿人口的日常活动数据 [7] - 公司开发了“技能采集手套”,其与机器人手具有完全相同的几何结构和传感器布局,彻底消除了数据转换断层 [11] - 公司开发了“技能转换系统”,能够对齐运动学和视觉的原始观测数据,消除人类特征,将手套数据转换为机器人数据的成功率高达90% [12] - 公司构建了核心基础设施,包括技能采集手套、技能转换系统及机器人Memo,耗时超过一年 [15] - 截至2025年底,公司的数据采集库已积累了约1000万个示例,全美有2000台数据采集手在进行采集 [8] 机器人硬件设计 - 机器人Memo采用升降设计,最高可达2.1米,以兼容不同身高采集员及高处物品操作 [30] - 机械手为4自由度的三指设计,手臂为7自由度 [30] - 手部设计通过寻找“黄金平衡点”,扩大了可抓取物体范围,实现了可靠的工具使用能力,并兼容日常物品 [11] - 硬件采用刚性和弹性聚合物混合材料,兼顾坚固性与安全性,软质外层有多种颜色可选 [31] - 机器人设计具备柔顺性且符合被动安全标准,断电也能保持姿态稳定 [32] - 充电1小时可执行4小时任务 [31] ACT-1模型能力展示 - 超长时序移动操作:在单次任务中,针对21种不同物体完成33种独特操作,共计68次灵巧交互,总移动距离超过130英尺(约40米) [20] - 零样本泛化至陌生家庭环境:模型无需针对特定环境训练,通过引入环境的3D地图作为输入约束,学会解读地图,从而能在全新的Airbnb房源中执行清理餐桌等任务 [21][22] - 推进灵巧性前沿:展示了叠袜子与操作家用浓缩咖啡机两项复杂任务,后者需要毫米级精度、双手协调及产生高扭矩 [26] - 模型是首个在单一端到端模型中,将长时序操作与地图引导导航相结合的基础模型 [22] 执行性能与数据采集 - 数据采集员(Memory Developer)演示任务的速度约为人类自然速度的一半 [30] - 模型运行速度约为数据采集速度的60-80% [30] - 技能采集手套是采集人类真实生活状态下“真实分布数据”最快、最有效的方法,能捕捉生活的“长尾”场景 [28] 软件与安全 - 机器人内置针对静态和动态障碍物的自动避障功能 [33] - 机器人只执行明确教授过的、实用且安全的任务,每种行为逻辑都受严格的数据审查机制约束 [33] - 公司不依赖用户家庭私密数据训练机器人,用户数据分享需经明确授权 [35]
Sunday的ACT-1分享!未使用任何机器人本体数据训练的VLA,解决超长时程任务
具身智能之心·2026-01-24 09:05