机器人训练数据
搜索文档
远超基线模型!X-Humanoid:推动机器人从 “真实数据” 向 “虚拟合成 + 互联网数据” 转型
具身智能之心· 2025-12-08 09:11
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Pei Yang等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 在 embodied AI 领域,视觉 - 语言 - 动作(VLA)模型与世界模型的发展虽展现出通用自主能力的巨大潜力,却始终受限于核心瓶颈——大规模、多样化机器人训 练数据的稀缺。现有解决方案要么依赖成本高昂的真实机器人数据采集,要么通过简单叠加机器人部件编辑第一视角人类视频,均无法应对第三人称视频中的全身 复杂动作、动态背景与严重遮挡问题。 新加坡国立大学 Show Lab 提出的 X-Humanoid 框架 ,以 "数据合成 - 模型适配 - 大规模生成" 为核心逻辑,首次实现第三人称人类视频到类人机器人视频的高质量 转化,为机器人训练提供了全新的数据生成范式。 论文题目:X-Humanoid: Robotize Human Videos to Generate Humanoid Videos at Scale 项 ...
干家务一小时挣1000元,具身智能时代人类新岗位
量子位· 2025-10-24 11:53
机器人行业投资与数据需求 - 机器人领域是当前人工智能最热门的领域之一,被预测将迎来其"ChatGPT时刻" [10] - 截至文章发布时,该领域的风险投资已激增至121亿美元 [10] 机器人训练数据挑战 - 机器人行业面临数据荒,缺乏现成的互联网数据集,必须从零开始在现实世界中生成训练数据 [11] - 真实数据(如通过专业设备记录人类活动或物理数据)质量高但规模有限、成本高 [12][13][14] - 合成数据(如在虚拟环境中生成)成本较低,能实现数据自由,例如NVIDIA Cosmos可生成逼真训练环境 [16] - 为兼顾真实性与规模性,行业普遍采用结合真实与合成数据的策略 [18] 数据服务市场动态 - 数据标注服务商(如Encord、Micro1、Scale AI)高价回收人类执行日常任务(如做家务)的视频作为训练素材 [7] - Encord对高技术性任务视频(如操作设备)提供的报酬最高可达每小时150美元 [19] - Micro1提供的报酬在每小时25至50美元之间 [20] - Scale AI已生成超过10万小时的训练影像 [21] - 有机器人初创公司以每小时10-20美元的报酬征集用户拍摄的家务视频 [23] - 优质数据依然短缺,市场上可购买的最大规模数据集仅约5000小时时长,远不能满足需求 [26]