行业背景与市场驱动 - 特斯拉、Figure AI等公司竞相开发人形机器人,导致训练所需的真实世界动作数据极为紧缺[8] - 2026年全球人形机器人市场预计达到42.3亿美元,到2027年特斯拉等公司的量产计划将使全球累计安装量突破10万台[23] - 机器人将进入工厂和家庭承担体力劳动,而训练它们的数据正来自当前从事体力劳动的工人[24] 数据采集的规模与模式 - 帕洛阿尔托的Micro1在全球71个国家招募约4000名工人,每月收到超过16万小时的视频素材,每人每周至少提交10小时录像[8] - Scale AI宣布已收集超过10万小时的素材[33] - 数据采集公司如Scale AI、Encord、DoorDash(通过Tasks应用)均在招募数据采集队伍[8] - 目前每月160万小时的素材量仍远远不够,行业需求可能高达几十亿小时,按当前速度采集需连续工作一万年[14] 数据采集的工作流程与挑战 - 应聘者需通过名为Zara的AI智能体面试并提交试录视频[10] - 工人需使用带有LiDAR传感器的iPhone(iPhone 12 Pro及以上机型)和头戴支架录制视频[13] - 录制要求双手始终在镜头内,动作需“保持自然速度”,但实际操作中为满足要求常需刻意放慢,导致动作不自然[11][12] - 提交的视频需经过AI和人工双重审核,仅约一半素材最终可用,被拒原因包括光线不足、手移出画面、动作太快或背景不当[13] - 工人按小时计酬,但视频若被拒则劳动无报酬;通过审核的视频还需由人工标注员逐帧标记动作类别、物体名称和运动轨迹[13] - 工人需不断变换录制内容以提供多样化场景,但家庭环境创意易耗尽,例如新德里家教需花一小时构思才能录满15分钟家务内容[13] 数据价值与定价差异 - 数据采集工作按小时计酬,时薪为15美元[9] - 不同地区数据价值差异显著,美国家庭的操作环境数据因预设消费者市场而更有价值,其工人时薪有时高达越南或印度工人的三倍[13] - 尽管时薪在当地有竞争力,但与流入机器人公司的数十亿美元投资相比,工人报酬微乎其微[22] 产业链与“幽灵劳动” - 让AI系统显得“聪明”的大量人工劳动(如标注、过滤、清洗数据)被称为“幽灵劳动”,通常不出现在产品介绍中[17][18] - 过去幽灵劳动主要是屏幕前的点击、标注,现在已扩展到对身体动作(如叠衣服、炒菜)的采集、定价和转售[21] - 原材料(动作数据)从印度、尼日利亚、菲律宾、肯尼亚等地的普通家庭流出,汇聚到帕洛阿尔托和旧金山的公司,再转化为产品[22] - 科技公司对数据的占有被学者称为“数据殖民主义”,延续了历史上对土地和资源的掠取逻辑,将日常生活转化为可被资本提取的原材料[22] - 工人处于信息末端,公司以保密为由不透露客户名单,工人不清楚数据如何存储或是否会被转售给第三方[22] - 这类劳动具有孤立性,工人往往需自发建立互助网络以维持工作意义感[22] 技术本质与哲学影响 - 训练过程本质上是将人类的“默会知识”(无法完全言说,通过实践习得的知识,如骑自行车)从身体里抽取出来,转化为机器可处理的数据[26][29][31] - 摄像头录下的不仅是动作,还包括手指感知布料重量、手腕翻转时机、视线追踪等细微的身体知识[31] - 数据殖民主义将包括铺床在内的日常生活本身变为一种“就在那里,随时可以被提取”的资源[34] - AI的冲击不仅在于取代知识工作者,最普通、不被算作技能的动作也在被采集,这使得“什么是人的劳动”成为一个实际的政治问题[34] - 将个人知识从具体的人身上剥离出来让其继续运转,引发了关于人作为知识承载者究竟拥有什么的根本性问题[36]
时薪100元的新工种:把iPhone绑在脑门上,替AI蒸馏自己
创业邦·2026-04-27 11:19