Workflow
人形机器人也要“进校学习”?数据采集成必答题
21世纪经济报道·2025-07-16 21:53

行业现状 - 真实场景数据稀缺制约具身智能行业发展,数据被认为是"卡脖子"问题 [1] - 不同于大语言模型可使用互联网数据,具身智能模型需专门采集视觉、触觉、力觉等多源异构数据 [1] - 单个场景训练需百万量级数据,行业早期缺乏高质量统一格式数据库 [4] 解决方案 - 德马科技与智元机器人合作建立全球首家人形机器人物流训练工厂,部署数十台机器人采集真实物流场景数据 [1] - 行业出现两种思路:英伟达等通过仿真数据生成,智元机器人等通过大规模真实数据采集厂 [4] - 企业搭建实景工厂依靠人工遥操采集真机数据,单个项目POC需2个月,高准确性需半年以上 [4] - 一套完整数据采集解决方案售价40万-50万元,包含机器人、硬件、软件、云服务等 [5] 市场动态 - 去年下半年以来具身智能数据采集厂密集落地,智元机器人数据采集中心2023年9月启用 [3] - 帕西尼具身智能超级数据工厂2024年6月投入运营 [3] - 合肥市具身智能机器人数据采集预训练场2024年6月启用 [1][4] - 国家地方共建人形机器人创新中心2024年1月启用全国首个异构训练场 [4] 政府参与 - 工业与人工智能产业发达地区政府主导建设公共服务平台数据采集中心 [5] - 政府平台采集数据归政府所有,积累后可提供给辖区企业使用 [5] - 青瞳视觉2023年开启人形机器人数据采集业务,覆盖政府、学校、企业端 [5] 行业挑战 - 硬件方案未收敛:轮式/双足方案、手部结构、传感器方案等尚未统一 [7] - 人形机器人快速迭代:每周模组修改,数月局部改造,半年更新一代 [7] - 当前数据采集集中在关节层,硬件不统一导致数据平台依赖性强、可复用性低 [7] - 本体精度问题和自由度不匹配导致真实数据采集精度不足,有效数据比例较低 [8]