Workflow
工程化能力
icon
搜索文档
一袋零食,难倒了11支顶尖机器人团队
第一财经· 2025-10-24 19:49
比赛核心事件 - 智元机器人与OpenDriveLab在IROS 2025主办AgiBot World Challenge国际挑战赛,11支来自清华、香港大学、阿里云等顶尖团队参赛[1] - 比赛设置家居、工业、超市三类环境共六个任务,由智元机器人G1统一执行,参赛队仅能使用单一模型应对所有场景[1] - 除开源数据集外,每支队伍获得200条真机数据用于训练,比拼重点在于模型泛化能力与团队工程化部署能力[1] - 在“挂零食”任务中所有参赛队伍尽数失败,完成率最高的队伍仅获得“抓取零食袋”的分数[1][2] 技术挑战分析 - “挂零食”任务失败主因是视觉噪声干扰和空间定位精度不足,挂钩目标在摄像头视野中像素占比极小导致模型难以稳定识别[4] - 即使模型能识别物体并执行放置动作,但因视觉信号噪声过多及挂钩点过于细小,最终无法成功完成挂载动作[4] - 相比之下,叠衣服、倒水、加热等长程任务完成率更高,显示行业在模型预训练与模仿学习方面已能支撑中等复杂度操作[5] - 行业难题正从动作层转向“理解世界”层面,需在视觉噪声、空间定位、物理交互等现实扰动场景中保持模型稳定性[9] 行业发展趋势 - 算法模型进步解决“能不能做”的问题,但真正工业落地从“可行”到“可用”需依赖硬件调试、控制优化、系统集成等工程环节[9] - 比赛意义在于让不同研究路径在同一平台跑通链路,验证从算法研发到测试的完整流程[9][10] - 智元机器人通过自建数据集、开源模型体系及二次开发平台,构建从数据、模型、仿真到真机部署的完整基础设施[10] - 工程化与全平台工具构建能力正成为推动通用机器人落地的关键变量,算法边界逼近现实世界时需强化系统集成[10] 公司生态建设 - 智元机器人发布并开源百万真机数据集AgiBot World,并推出二次开发平台“灵创”以降低研发门槛[10] - “灵创”平台通过AI视觉动作提取、智能重定向算法和云端模仿学习框架,实现不用编程即可进行二次开发[10] - 公司致力于搭建完整工具链,吸引更多开发者加入,系统性验证具身智能基础设施[10]