Workflow
智元机器人G1
icon
搜索文档
一袋零食,难倒了11支顶尖机器人团队
第一财经· 2025-10-24 20:31
比赛核心结果与行业现状 - 在IROS 2025国际挑战赛中,机器人“挂零食”任务完成率为0%,所有11支参赛队伍均失败,完成度最高的队伍仅获得“用抓夹抓起零食袋”的分数 [3][4][5] - 相比之下,叠衣服、倒水、用微波炉加热食物等中等复杂度任务的完成率较高,显示行业在机器人动作学习方面已取得显著进步 [8][10] - 比赛任务设置在家居、工业、超市三类环境,参赛队伍需使用单一模型应对所有任务,比拼的是模型在多场景下的泛化能力与工程化能力 [3] 技术挑战与瓶颈分析 - “挂零食”任务失败的主要原因是视觉识别与空间定位精度不足,具体挑战包括:零食包装颜色单一导致机器人难以分辨前后层,挂钩体积细小在摄像头视野中仅占极少像素点 [7] - 该任务暴露出现阶段机器人技术的核心难题已从“如何学会做动作”转向“理解世界”,即在视觉噪声、空间定位、物理交互等现实扰动场景中保持模型稳定 [10] - 清华大学参赛团队指出,模型虽能识别物体并执行放置动作,但因视觉信号噪声过多及目标点过于细小,最终无法稳定完成任务 [7][8] 公司战略与生态建设 - 智元机器人将比赛视为对具身智能基础设施的系统性验证,旨在通过自建数据集、开源模型体系及开发者平台,搭建从数据、模型、仿真到真机部署的完整链路 [11] - 公司于去年12月开源了百万真机数据集AgiBot World,并在比赛后发布新的二次开发平台“灵创”,该平台通过AI视觉动作提取等技术降低开发门槛 [11][12] - 公司强调工业落地的关键不仅在于算法模型解决“能不能做”的问题,更取决于硬件调试、控制优化、系统集成等工程环节,从“可行”到“可用”存在较长工程化距离 [11] 行业发展趋势 - 比赛结果表明,推动通用机器人落地的关键变量正从算法边界转向工程化与全平台工具的构建能力 [12] - 行业研究路径正从学术团队的方向探索与天花板验证,转向产业链协同以解决工程化落地问题 [11] - 平台化工具链的完善将进一步降低研发门槛,吸引更多开发者加入,加速具身智能技术的实际应用 [11][12]
一袋零食,难倒了11支顶尖机器人团队
第一财经· 2025-10-24 19:49
比赛核心事件 - 智元机器人与OpenDriveLab在IROS 2025主办AgiBot World Challenge国际挑战赛,11支来自清华、香港大学、阿里云等顶尖团队参赛[1] - 比赛设置家居、工业、超市三类环境共六个任务,由智元机器人G1统一执行,参赛队仅能使用单一模型应对所有场景[1] - 除开源数据集外,每支队伍获得200条真机数据用于训练,比拼重点在于模型泛化能力与团队工程化部署能力[1] - 在“挂零食”任务中所有参赛队伍尽数失败,完成率最高的队伍仅获得“抓取零食袋”的分数[1][2] 技术挑战分析 - “挂零食”任务失败主因是视觉噪声干扰和空间定位精度不足,挂钩目标在摄像头视野中像素占比极小导致模型难以稳定识别[4] - 即使模型能识别物体并执行放置动作,但因视觉信号噪声过多及挂钩点过于细小,最终无法成功完成挂载动作[4] - 相比之下,叠衣服、倒水、加热等长程任务完成率更高,显示行业在模型预训练与模仿学习方面已能支撑中等复杂度操作[5] - 行业难题正从动作层转向“理解世界”层面,需在视觉噪声、空间定位、物理交互等现实扰动场景中保持模型稳定性[9] 行业发展趋势 - 算法模型进步解决“能不能做”的问题,但真正工业落地从“可行”到“可用”需依赖硬件调试、控制优化、系统集成等工程环节[9] - 比赛意义在于让不同研究路径在同一平台跑通链路,验证从算法研发到测试的完整流程[9][10] - 智元机器人通过自建数据集、开源模型体系及二次开发平台,构建从数据、模型、仿真到真机部署的完整基础设施[10] - 工程化与全平台工具构建能力正成为推动通用机器人落地的关键变量,算法边界逼近现实世界时需强化系统集成[10] 公司生态建设 - 智元机器人发布并开源百万真机数据集AgiBot World,并推出二次开发平台“灵创”以降低研发门槛[10] - “灵创”平台通过AI视觉动作提取、智能重定向算法和云端模仿学习框架,实现不用编程即可进行二次开发[10] - 公司致力于搭建完整工具链,吸引更多开发者加入,系统性验证具身智能基础设施[10]