幽灵劳动
搜索文档
时薪15美元的新工种:把iPhone绑在脑门上,替AI蒸馏自己
36氪· 2026-04-27 17:40
AI训练数据采集行业现状 - 随着特斯拉、Figure AI等公司竞相开发人形机器人,训练它们所需的真实世界动作数据变得极为紧缺[9] - 为获取数据,帕洛阿尔托的Micro1公司在全球71个国家招募了约4000名工人,每月收到超过16万小时的视频素材[9] - Scale AI和Encord等公司也在招募各自的数据采集队伍,DoorDash甚至在2026年3月推出Tasks应用,让旗下送餐员顺带在家录家务视频[10] - 数据采集工作流程包括通过名为Zara的AI智能体面试、使用特定设备(如带LiDAR传感器的iPhone 12 Pro以上机型)录制、以及后续的AI与人工双重审核[12][14] - 视频素材审核严格,只有大约一半的素材最终可用,被拒原因包括光线不足、手移出画面、动作太快或背景出现不该出现的东西[14] - 工人按小时计酬,但若视频被拒则劳动白费,通过审核的视频还需由另一批人工标注员进行逐帧标注[14] 数据价值与市场供需 - 美国家庭的视频数据比其他地区卖得更贵,因为机器人公司预设美国消费者会最先购买人形机器人,对应的工人时薪有时高达越南或印度工人的三倍[14] - Micro1的副总裁表示,目前每月160万小时的素材远远不够,大概需要几十亿小时,按照目前的采集速度,大概要连续工作一万年[15] - 2026年,全球人形机器人市场预计达到42.3亿美元,而到2027年,特斯拉等公司的量产计划将使全球累计安装量突破10万台[23] - Scale AI宣布已收集超过10万小时的素材[33] 数据采集的劳动力与伦理问题 - 数据采集工作被描述为“幽灵劳动”,即那些让AI系统显得“聪明”、却从不出现在任何产品介绍里的人工劳动[17][18] - 过去,幽灵工作主要发生在屏幕前,现在是身体本身的动作(如叠衣服、炒菜)开始成为可以被采集、定价、转售的原材料[21] - 这些数据原材料从印度、尼日利亚、菲律宾、肯尼亚等地的普通家庭流出,汇聚到帕洛阿尔托和旧金山的公司[22] - 存在显著的信息不对等,公司以保密为由不向工人透露客户名单,工人也不清楚自己的数据将如何被存储或是否会被转售[22] - 工人时薪(例如15美元)在本地可能有竞争力,但放在流入机器人公司的数十亿美元投资面前,连零头都算不上[22] - 这类劳动具有孤立性,工人们往往会自发建立非正式的互助网络以维持意义感[22] 数据采集的哲学与技术内涵 - 数据采集过程实质上是试图将人类的“默会知识”(即无法完全言说、通过实践习得的身体知识)从人的身体里抽取出来,转化为机器可以处理的数据[26][30][31] - 被录制的不仅是动作本身,还包括手指如何感知布料重量、手腕如何在恰当的时机翻转等细微的感知与直觉[31] - 数据殖民主义框架指出,科技公司对数据的占有延续了历史殖民主义对土地和资源的掠取逻辑,把人类的日常生活本身转化为一种可供资本提取的原材料[22][34] - 最普通、最不被算作技能的那些动作也在被采集,这使得“什么是人的劳动”从一个哲学问题变成了一个实际的政治问题[34]