数据公司正在把高级牛马当饲料榨干?
虎嗅APP·2026-01-12 21:34

文章核心观点 - 人工智能训练师(特别是数据标注员)的工作看似高薪且前景广阔,但实质上可能是一种对从业者经验和知识的“一次性买断”,从业者在将自身专业经验“喂养”给AI后,面临被替代的风险,职业发展脆弱且缺乏长期保障 [7][9][24][29] 人工智能训练师(数据标注)行业现状与趋势 - 行业地位与需求:人工智能训练师自2020年2月起被纳入国家职业分类目录,数据标注是基础工作,未来五年中国该领域人才缺口可能高达百万 [10] - 工作内容演变:数据标注工作从早期的简单分类、画框,升级为涉及逻辑推理、价值判断和创造性示范的复杂任务,例如评估、修改模型回答,甚至完整示范人类专家的决策过程 [17][18] - 技术替代风险:在一些成熟的文本模型中,由AI合成的数据已经替代了80%的人工标注,从业者训练的AI正在成为自身的替代者 [29] 从业者画像与招聘门槛 - 门槛显著提高:招聘要求从早期的“会上网就行”或高中学历,已进化到普遍要求本科及以上学历(占比超一半),且垂直领域要求专业背景,部分岗位需通过专业笔试 [10][13] - 高要求岗位示例:某“模型专家项目”招聘时薪100~400元,要求985硕士学历、高壁垒专业背景及2年以上工作经验,招聘通过率约为50%(二进一) [13][14] - 大厂正式岗位薪资:字节跳动为AI训练岗开出月薪2~4万元、15薪的待遇;小红书为“AI标注产品”岗开出月薪2~4万元、16薪的待遇 [21] 工作体验与行业痛点 - 工作强度与监控:工作界面常自带计时器,实时监测屏幕状态,无操作会自动暂停,带薪摸鱼几乎不存在,工作节奏紧凑 [29] - 工作内容枯燥:工作高度工业化,例如在7小时内需给AI下50~100条指令,每条需反复生成六七次才能选出合适结果,充满重复劳动 [26] - 报酬不稳定与欺诈风险:从业者可能经历多轮免费试标,且存在被骗稿、被以模糊理由扣钱或拒付报酬的情况,实际到手收入可能不及预期 [27] 商业模式与行业结构 - 市场集中与波动性:高端数据标注客户群体狭窄,主要围绕头部大模型公司,订单易受客户更换供应商或自建团队影响而迅速缩水 [32] - 行业缺乏护城河:业务高度同质化,需求零散多变,过去积累的经验难复用,标注员流失率高,但进入门槛低导致新玩家不断涌入 [32] - 资本案例:2025年6月,Meta以143亿美元收购数据标注公司Scale AI;向从业者发送工作邮件的Mercor公司估值高达百亿美元 [32] 从业者价值与伦理困境 - “一次性买断”性质:高时薪(如120美元/小时或宣称的千元时薪)更像是对从业者过往经验和知识的“一次性买断费”,一旦个人经验枯竭,任务可能停止 [8][9] - 核心价值与成本:真实数据是最稀缺昂贵的资源,雇佣高学历专家(如每小时100美元)的成本远低于模型出错(如自动驾驶漏标行人导致数千万路测失败,或法律合同理解偏差引发上亿诉讼)的代价 [17] - 职业前景不安:从业者普遍怀揣“教会徒弟,饿死老师”的不安,担心自己只是AI进化路上的一次性耗材,行业在升级同时正在清退早期基础岗位从业者(如某扶贫数据基地要求将“妈妈工人”比例降至25%以下) [29][30]

数据公司正在把高级牛马当饲料榨干? - Reportify