Workflow
UMI
icon
搜索文档
具身界影响力最大的两位博士创业了!
自动驾驶之心· 2025-11-18 08:05
创业团队核心成员 - Tony Z Zhao担任公司CEO 为斯坦福大学计算机科学专业三年级博士生(已辍学) 在校期间主导提出ALOHA ALOHA2 Mobile ALOHA等一系列具身智能领域有影响力的工作方案 [2][4][5] - Cheng Chi担任公司CTO 为哥伦比亚大学博士及斯坦福大学新教师奖学金获得者 师从Shuran Song教授 提出通用操作接口UMI(获RSS 2024最佳系统论文决赛奖)及Diffusion Policy方案 [2][4][10] 行业背景与影响力 - 创业团队两位成员被描述为具身界影响力最大的博士 其技术背景与研究成果在行业内具有显著知名度 [2][4] - 公司技术基础建立在ALOHA系列方案 UMI通用操作接口及Diffusion Policy等前沿研究之上 这些工作对机器人操作与具身智能发展有重要贡献 [4][5][10]
具身界影响力最大的两位博士创业了!
具身智能之心· 2025-11-17 12:00
创业团队核心成员 - 公司CEO为Tony Z Zhao,其为斯坦福大学计算机科学专业三年级博士生(已辍学)[2][5] - 公司CTO为Cheng Chi,其为哥伦比亚大学博士及斯坦福大学新教师奖学金获得者[2][10] - 两位创始人在具身智能界具有重要影响力[2] 创始人的技术背景与成就 - Tony Z Zhao在斯坦福期间主导参与了ALOHA、ALOHA2、Mobile ALOHA等具有行业影响力的机器人项目[4][5] - Cheng Chi是通用操作接口UMI的主要提出者,该成果获RSS 2024最佳系统论文决赛奖,同时是Diffusion Policy方案的作者[4][10] - 这些技术成果为公司在机器人操作与策略学习领域奠定了坚实基础[4][5][10]
斯坦福机器人新作!灵巧操作跟人学采茶做早餐,CoRL 2025提名最佳论文
具身智能之心· 2025-10-02 18:04
文章核心观点 - 提出一种名为DexUMI的数据采集与策略学习框架,通过硬件和软件双重适配,以人手作为自然接口将灵巧操作技能迁移至多种灵巧手 [4] - 该框架相比传统遥操作方法,数据采集效率提升3.2倍,在多项复杂任务中平均成功率高达86% [10][35] - 框架验证了其有效性,特别是在国产灵巧手星动XHAND 1上表现出色,为大规模灵巧手现实数据高效采集建立了新范式 [7][35][38][40] DexUMI框架的技术原理 - **硬件创新**:为每款灵巧手设计专用可穿戴外骨骼装置,通过硬件优化参数精准匹配灵巧手指运动轨迹,并采用编码器、150°广角相机和iPhone ARKit技术追踪关节运动和手腕位姿 [19][20][23] - **软件适配**:采用包含四个步骤的数据处理流水线,包括人手与外骨骼分割、环境背景修复、生成对应灵巧手视频、机器人示教视频合成,确保训练与部署阶段视觉输入一致 [24][25][28][29] - **核心优势**:直接提供触觉反馈,而典型遥操作系统通常无法提供,同时效率远超传统遥操作方法 [37] 实验验证与性能表现 - **测试平台**:在两种灵巧手硬件平台上验证,包括欠驱动的Inspire手(12自由度,6主动自由度)和全驱动的星动XHAND 1(12个主动自由度) [10][34] - **任务设置**:包含立方体任务、蛋盒开启、茶艺操作、厨房任务等四项现实任务,测试基础操作精度、复杂手型控制、长时序任务综合能力 [31][34] - **关键结果**:软件适配对弥合视觉差距至关重要,在两种灵巧手上均表现优异,平均任务成功率达到86% [10][35] 星动纪元XHAND 1的突出表现 - **技术特点**:采用全驱动设计和独特的关节全直驱技术,具备12个主动自由度,并配备指尖270度覆盖的高精度触觉传感器 [34][40][42] - **任务表现**:单独完成了包含四个连续步骤的厨房长序列任务,展示了在长时序任务中结合精确动作、触觉感知及非指尖操作的综合能力 [40] - **行业意义**:其卓越表现为协同打造科研基础设施、建立数据采集共享社区提供了可能,将加速灵巧操作在实际应用场景的落地 [42]
斯坦福洗碗机器人新作!灵巧手跟人学采茶做早餐,CoRL 2025提名最佳论文
量子位· 2025-10-02 13:30
文章核心观点 - 提出名为DexUMI的数据采集与策略学习框架,通过硬件与软件双重适配,利用人手作为自然接口将灵巧操作技能迁移至多种灵巧手 [2] - 该框架旨在解决人手与灵巧手之间的具身差异,相比传统遥操作方法,数据采集效率提升3.2倍,在复杂任务中平均成功率高达86% [7][32] - 框架验证了其在精密操作、多接触交互及长时序任务中的能力,为大规模灵巧手现实数据高效采集建立了新范式 [35][36][37] DexUMI框架的技术原理 - **硬件适配**:针对每款灵巧手设计专用可穿戴外骨骼装置,通过硬件优化调整参数(如连杆长度),精准匹配灵巧手指运动轨迹 [18] - 外骨骼装置采用编码器捕捉关节运动,配备150°广视场角相机记录视觉数据,并利用iPhone ARKit技术追踪手腕位姿 [19] - **软件适配**:采用数据处理流水线,首先从示教视频中分割移除人手及外骨骼,随后利用目标灵巧手及环境背景进行视频修复,确保训练与部署阶段视觉输入一致 [22] - 软件处理包含四个具体步骤:人手与外骨骼分割、环境背景修复、生成对应灵巧手视频、机器人示教视频合成 [25][26][27] DexUMI的性能验证与结果 - 在两款灵巧手硬件平台(全驱和欠驱)上验证了框架的有效性 [7] - 在四项现实任务中进行评估,包括立方体任务、蛋盒开启、茶艺操作和厨房任务,每项任务进行20次评估回合 [29][33] - 实验结果显示,软件适配对于弥合视觉差距至关重要,例如在学习蛋盒开启动作时,若无软件适配则无法精准交互 [31] - 在包含需多指协同的长时序复杂任务中,DexUMI实现了86%的平均任务成功率 [32] 涉及的灵巧手硬件 - **星动纪元XHAND 1**:采用全驱动设计,具备12个主动自由度,大拇指三个自由度,食指三个自由度,其余三指各两个自由度 [33] - **Inspire Hand**:采用欠驱动设计,12自由度(6主动自由度),拇指2主动2被动自由度,其余四指各1主动1被动自由度 [33] - 星动XHAND 1在测试中表现卓越,单独完成了包含四个连续步骤的厨房长序列任务 [37] - 星动XHAND 1的性能得益于其关节全直驱方案以及指尖270度覆盖的高精度触觉传感器 [37][39] 行业影响与前景 - DexUMI框架被视为对去年发布的UMI(针对夹爪类机器人)的升级,从夹爪扩展到更复杂、更高自由度的灵巧手,可能引发新一轮灵巧手数据采集革命 [5] - 该研究在CoRL 2025中被提名为最佳论文,显示了其学术与行业影响力 [5] - 框架为建立数据采集共享社区奠定基础,众多数据采集者、研究机构及企业可共同贡献和使用高质量数据集,降低数据采集成本,避免资源浪费 [39][41] - 这种数据共享模式将提高数据采集效率,加速真实数据在Scaling law中的比例,从而推动灵巧操作在实际应用场景的落地和整体市场规模的扩大 [41]