时薪100元的新工种：把iPhone绑在脑门上，替AI蒸馏自己

行业背景与市场驱动 - 特斯拉、Figure AI等公司竞相开发人形机器人，导致训练所需的真实世界动作数据极为紧缺[8] - 2026年全球人形机器人市场预计达到42.3亿美元，到2027年特斯拉等公司的量产计划将使全球累计安装量突破10万台[23] - 机器人将进入工厂和家庭承担体力劳动，而训练它们的数据正来自当前从事体力劳动的工人[24] 数据采集的规模与模式 - 帕洛阿尔托的Micro1在全球71个国家招募约4000名工人，每月收到超过16万小时的视频素材，每人每周至少提交10小时录像[8] - Scale AI宣布已收集超过10万小时的素材[33] - 数据采集公司如Scale AI、Encord、DoorDash（通过Tasks应用）均在招募数据采集队伍[8] - 目前每月160万小时的素材量仍远远不够，行业需求可能高达几十亿小时，按当前速度采集需连续工作一万年[14] 数据采集的工作流程与挑战 - 应聘者需通过名为Zara的AI智能体面试并提交试录视频[10] - 工人需使用带有LiDAR传感器的iPhone（iPhone 12 Pro及以上机型）和头戴支架录制视频[13] - 录制要求双手始终在镜头内，动作需“保持自然速度”，但实际操作中为满足要求常需刻意放慢，导致动作不自然[11][12] - 提交的视频需经过AI和人工双重审核，仅约一半素材最终可用，被拒原因包括光线不足、手移出画面、动作太快或背景不当[13] - 工人按小时计酬，但视频若被拒则劳动无报酬；通过审核的视频还需由人工标注员逐帧标记动作类别、物体名称和运动轨迹[13] - 工人需不断变换录制内容以提供多样化场景，但家庭环境创意易耗尽，例如新德里家教需花一小时构思才能录满15分钟家务内容[13] 数据价值与定价差异 - 数据采集工作按小时计酬，时薪为15美元[9] - 不同地区数据价值差异显著，美国家庭的操作环境数据因预设消费者市场而更有价值，其工人时薪有时高达越南或印度工人的三倍[13] - 尽管时薪在当地有竞争力，但与流入机器人公司的数十亿美元投资相比，工人报酬微乎其微[22] 产业链与“幽灵劳动” - 让AI系统显得“聪明”的大量人工劳动（如标注、过滤、清洗数据）被称为“幽灵劳动”，通常不出现在产品介绍中[17][18] - 过去幽灵劳动主要是屏幕前的点击、标注，现在已扩展到对身体动作（如叠衣服、炒菜）的采集、定价和转售[21] - 原材料（动作数据）从印度、尼日利亚、菲律宾、肯尼亚等地的普通家庭流出，汇聚到帕洛阿尔托和旧金山的公司，再转化为产品[22] - 科技公司对数据的占有被学者称为“数据殖民主义”，延续了历史上对土地和资源的掠取逻辑，将日常生活转化为可被资本提取的原材料[22] - 工人处于信息末端，公司以保密为由不透露客户名单，工人不清楚数据如何存储或是否会被转售给第三方[22] - 这类劳动具有孤立性，工人往往需自发建立互助网络以维持工作意义感[22] 技术本质与哲学影响 - 训练过程本质上是将人类的“默会知识”（无法完全言说，通过实践习得的知识，如骑自行车）从身体里抽取出来，转化为机器可处理的数据[26][29][31] - 摄像头录下的不仅是动作，还包括手指感知布料重量、手腕翻转时机、视线追踪等细微的身体知识[31] - 数据殖民主义将包括铺床在内的日常生活本身变为一种“就在那里，随时可以被提取”的资源[34] - AI的冲击不仅在于取代知识工作者，最普通、不被算作技能的动作也在被采集，这使得“什么是人的劳动”成为一个实际的政治问题[34] - 将个人知识从具体的人身上剥离出来让其继续运转，引发了关于人作为知识承载者究竟拥有什么的根本性问题[36]