Workflow
数据标注服务
icon
搜索文档
四中全会精神在基层丨大山深处,数据标注员越来越多
新华网· 2025-12-18 08:18
行业趋势与政策驱动 - 生成式人工智能和数据要素市场化加快推进,高质量数据集需求旺盛,推动数据标注产业发展[3] - 贵州省“十四五”期间数字产业规模年均增速达16.2%,预计到今年底将达到2800亿元左右,其中软件和信息技术服务业收入规模突破千亿元[5] - 国家层面提出全面实施“人工智能+”行动,加强人工智能同产业发展等相结合,抢占产业应用制高点,为数字经济发展提供指引[5] 地方产业发展与规模 - 贵州省大力培育数据标注全产业链,前期已集聚67家数据标注企业,从业人员总人数超过9100人[5] - 贵阳市白云区以贵州省首个数据开发利用加工基地为核心,已建成多个企业特色园区和超8万平方米的白云数据空间产业化基地[3] - 白云区规划数个标注基地,预计将带动超5000人就业[3] 公司运营与扩张 - 南国大数据(贵州)有限公司已在多个市州拥有分公司,目前员工规模超700人,未来有望带动超2000人就业[3] - 公司正与学校建立科研团队,研发自己的标注平台和预标注平台,以更高效地完成数据处理工作[5] - 公司通过产教融合模式,今年超过400名来自合作院校的学生在该企业完成实习,其中约20%的人通过考核留任[4] 业务内容与技术演进 - 数据标注业务服务于汽车自动驾驶的路况识别、AI动画视频生成等,是让人工智能更加智能的基础[1] - 标注工作已从简单劳动转向需要专业知识的创造性工作,AI技术的迭代倒逼从业者持续学习[5] - 具体标注内容包括对真实道路图片里的车辆、路沿、红绿灯进行框线标注,并填写“无遮挡”“路沿高15厘米”等属性信息[1] 政策激励与人才支撑 - 2025年,贵州出台政策对数据标注企业给予奖励:企业当年数据标注从业人员首次达300人或营收达到3000万元,即可获得100万元奖励,根据企业规模,最高奖励达1000万元[3] - 政策红利持续释放推动企业成长[3] - 地方大数据发展管理局与全市多所开设大数据专业的院校建立紧密联系,向企业进行人才输送,为专业人才提供实践机会和职业发展平台[3]
大山深处,数据标注员越来越多
人民日报· 2025-12-18 06:11
(据新华社电) 《 人民日报 》( 2025年12月18日 11 版) (责编:胡永秋、杨光宇) 走进贵州贵阳市白云区的一家数据标注孵化基地,此起彼伏的鼠标点击声传来。项目经理赵玉徕正在指 导组内的年轻人在电脑屏幕上将一张张真实道路图片里的车辆、路沿、红绿灯逐一框线标注,再精准填 写"无遮挡""路沿高15厘米"等属性信息。另一边的年轻人,正逐帧为动漫画面补充解释说明。 近年来,随着生成式人工智能、数据要素市场化加快推进,高质量数据集需求旺盛。在此背景下,贵州 的山区县乡不断"长"出一座座数据标注基地。为数据打上标签,正成为贵州年轻人的新职业。 2025年,贵州出台鼓励政策,对数据标注企业给予奖励:企业当年数据标注从业人员首次达300人或营 收达3000万元,即可获得100万元奖励。根据企业规模,奖励分为多档,最高奖励达1000万元。"我们已 建成多个企业特色园区和超8万平方米的白云数据空间产业化基地。"白云区大数据发展管理局局长吴利 豪介绍,白云区规划数个数据标注基地,预计将带动超5000人就业。 "要撑起这样大规模的产业布局,人才是关键。"吴利豪介绍,为此,白云区已与当地多所开设大数据专 业的院校建立紧密联 ...
四中全会精神在基层|大山深处,数据标注员越来越多
新华社· 2025-12-17 20:33
项目经理赵玉徕正在指导组内的年轻人在电脑屏幕上将一张张真实道路图片里的车辆、路沿、红绿灯逐 一框线标注,再精准填写"无遮挡""路沿高15厘米"等属性信息。另一排的年轻人正逐帧为动漫画面补充 解释说明。 "这些对空间、逻辑和意图进行说明的业务,主要服务于汽车自动驾驶的路况识别、AI动画视频生成 等,是让人工智能更加'智能'的基础。"赵玉徕解释道。 当数字经济的浪潮涌入黔贵大地,贵州的山区县乡里不断"长"出一座座数据标注基地。为数据打上标 签,正成为贵州年轻人毕业后"触手可及"的新职业。 走进贵州省贵阳市白云区的南国数据标注孵化基地,此起彼伏的鼠标点击声传来。 "要撑起这样大规模的产业布局,人才支撑是关键。"吴利豪介绍,为此白云区已与全市多所开设大数据 专业的院校建立紧密联系,向企业进行人才输送,也为数据产业相关专业人才提供实践机会和职业发展 平台。 "这种产教融合的模式,让学生在校期间就接触实际项目,兼具理论和实操技能的毕业生,经过考核可 以直接上岗。"李长春介绍,今年超过400名来自合作院校的学生在该企业完成实习,其中约20%的人通 过考核留任。 记者了解到,以往数据标注员的工作比较简单枯燥,技术含量不高。 ...
探索跨境“来数加工”,东莞竞逐高端数据标注新赛道
21世纪经济报道· 2025-12-05 14:27
数据标注作为激活数据要素价值、衔接算法模型与产业应用的核心环节,正为大模型训练、自动驾驶等前沿领域提供核心支撑。 (原标题:探索跨境"来数加工",东莞竞逐高端数据标注新赛道) 南方财经记者程浩 东莞报道 12月2日,对于向春燕来说是一个大日子,她负责的东莞驰千数据公司正式落户东莞万江数据标注产业园(以下简称"东莞数标园")。作为百度云 的数据合作伙伴,驰千数据跟随百度云从重庆毕节来到东莞,开启粤港澳大湾区数据标注新旅程。 数据、算法和算力是构建AI系统的三大核心要素,随着AI模型训练进入下半场,行业垂直模型和智能体方兴未艾,数据标注的重要性正被重新评 估。数据标注脱离了原来从简单的人工标注,开始向高技术含量、高知识密度和高价值应用数据领域延伸,数据标注产业正从劳动密集型加速向 知识技术密集型迭代。 东莞作为科创制造强市,拥有丰富的人工智能应用场景和深厚的工业数据积淀。当前,东莞正全力推进国家人工智能应用中试基地与数据产业集 聚区建设,以"湾区数谷"为重要载体,率先布局高质量数据标注产业,对海量工业数据进行深度挖掘与价值提炼,加快形成一批行业级高质量数 据集,促进人工智能与先进制造深度融合。 工信部电子五所人工 ...
5000人一夜被裁了,Mercor降薪重聘,吃相太难看
36氪· 2025-12-01 11:24
文章核心观点 - AI数据标注行业存在结构性矛盾,资本市场的繁荣与底层劳动力处境的恶化形成鲜明对比,AI公司通过将工作外包给全球合同工来降低成本并规避责任,导致标注工人工作不稳定、薪酬下降且缺乏保障 [1][8][16] AI数据标注项目变动与裁员事件 - AI数据公司Mercor突然提前终止了与Meta合作的“Musen项目”,导致约5000名数据标注工人被解雇 [2] - 几天后,Mercor以新项目“Nova”重新雇佣工人,工作内容几乎相同,但时薪从21美元降至16美元,实质是降薪 [4][9] - 被裁员工多为临时合同工,没有保险、带薪假和议价空间,许多人因经济压力接受了降薪的新合同 [11][13] AI数据标注行业的商业模式与潜规则 - Mercor在关闭项目并裁员后不久,以更低薪酬重启类似工作的操作,在行业内并非个例,xAI、Scale AI、Appen等公司都有类似循环 [6] - AI数据标注公司普遍采用将工作拆解并外包给全球“独立合作者”或“自由职业者”的模式,这使公司规避了雇佣正式员工的责任 [16] - Mercor在近期完成新一轮融资后,估值已接近100亿美元,但其业务操作凸显了行业追求高估值与压缩底层成本并行的现象 [6] AI行业宏观趋势与劳动力市场背离 - 2025年上半年,科技行业贡献了美国GDP增长的92%,但同期科技企业的裁员数量却创下2003年以来最高纪录 [12] - 包括亚马逊、谷歌、Meta在内的科技巨头在持续进行“优化团队”和裁员,例如亚马逊裁掉了1.4万名企业员工 [12] - 行业呈现利润增长与岗位减少、公司扩张与人员清空并存的矛盾局面 [12] AI数据标注工人的处境与角色 - 数据标注工人是AI训练中最底层但最关键的一环,他们帮助AI学会识别图像和理解文字,被比喻为“AI世界的建筑工” [2][12] - 这些工人被称为“灵活就业”或“自由职业者”,但现实中缺乏稳定性和保障,其“自由”更像是一种被“放生”的状态 [16] - 工人的劳动为AI模型创造了价值,但其自身却被排除在CEO们所描绘的“人类繁荣”愿景之外,工资甚至出现倒退 [12][15][16]
东北三省共建数据标注产业集群
辽宁日报· 2025-11-23 08:48
产业战略规划 - 辽宁、吉林、黑龙江三省将共建具备全球竞争力的数据标注产业集群,并谋划组建东北数据标注解决方案联合体 [1] - 东北地区将以专业化、智能化、国际化为导向,通过政府引导、企业主体、市场运作的协同共建模式,构建区域性产业集群体系 [2] - 联合体将整合各地资源和优势,为全国客户提供全栈式、高价值的解决方案,并联合开拓应用场景 [2] 产业发展现状 - 沈阳市作为国家级数据标注基地之一,已标注数据总量超过8323TB,形成134个高质量数据集,应用于76个大模型 [1] - 沈阳市参与制定国家标准2项、行业标准4项,引育数据标注企业65家,从业人员达1.18万余人,产业规模约25.9亿元 [1] - 产业加快数据要素价值释放,已交易数据集28个,交易金额达1.02亿元 [1] 应用与生态建设 - 数据标注被定义为人工智能训练过程中的关键环节,是将数据“原油”炼成“汽油”的关键工艺 [1] - 联合体将“打包”东北的工业、农业、文旅等全域产业升级需求,为区域内标注企业提供试验田和首用地 [2] - 目标是建设覆盖东北亚的数据标注产业,形成专业化分工协作、互联互通的产业生态 [2]
全国高质量数据集和数据标注产业供需对接大会在宁举行
南京日报· 2025-11-06 11:33
大会概况与核心成果 - 大会于11月5日在南京举行,主题为“推进高质量数据集建设,淬炼人工智能数据燃料”,是国内首个聚焦高质量数据集与数据标注全链条的全国性对接平台 [1] - 大会吸引全国超过500家企业参与,现场达成合作90余项,累计交易金额突破9亿元人民币 [1] - 现场启动“数智未来”高质量数据集开发者创新大赛,并正式发布高质量数据集建设公共赋能平台,提供一站式数据服务 [2] 参与方与行业覆盖 - 京东科技、阿里云、华为云、出门问问、企查查、澳鹏中国、上海库帕斯、江苏省人民医院及江苏省数据交易所等9家代表企业分享了在电商、云计算、医疗、金融、工业等领域的落地实践 [2] - 大会设置主会场及医疗健康、智慧能源、工业制造、交通运输、文化旅游五大行业供需对接专场,覆盖大模型训练和行业智能化转型的数据需求 [1] - 国家数据发展研究院院长胡坚波、中国电子技术标准化研究院副院长范科峰等权威机构负责人分享了高质量数据集的建设路径、标准与评测规范 [2] 产业发展模式与地方实践 - 多个省市结合本地产业特色,在能源、交通、文旅等领域开展差异化探索,形成“国家引导、地方实践、企业主导”的高质量数据集建设新路径 [2] - 南京市将高质量数据集建设作为核心抓手,在国家数据局发布的16个高质量数据集建设行业领域已实现全覆盖,初步形成“政策引领、创新驱动、产业集聚、应用丰富、开放合作”的发展格局 [3] - 高质量数据集的建设正从顶层设计加速走向产业实践的“深水区”,一批跨行业的合作成果集中亮相 [2]
现场撮合交易额超9亿元!全国首场高质量数据集和数据标注产业供需对接大会在宁举办
扬子晚报网· 2025-11-05 21:41
大会概况与核心成果 - 2025全国高质量数据集和数据标注产业供需对接大会在南京成功召开 吸引全国超过500家企业参与 现场达成合作90余项 累计交易金额突破9亿元人民币[1] - 大会主题为推进高质量数据集建设 淬炼人工智能数据燃料 设置主会场及医疗健康 智慧能源 工业制造 交通运输 文化旅游五大行业供需对接专场[1] - 京东科技 阿里云 华为云等9家代表企业分享了高质量数据集在电商 云计算 医疗 金融 工业等领域的落地实践[1] 产业共识与发展趋势 - 企业普遍认为构建标准化 规模化 可信化的数据供应链已成为推动大模型商业化应用与行业智能化的关键[1] - AI产业已从模型竞争步入数据竞争时代 高质量 场景化数据是制约AI规模化应用的最关键瓶颈 尤其在农业 工业等复杂物理世界领域[4] - 高质量数据集将真正成为人工智能时代的新石油 为数字中国建设注入强劲动能[4] 平台建设与生态发展 - 高质量数据集建设公共赋能平台正式发布 提供数据集全生命周期服务及多模态数据标注能力 保障数据清洗及全链路安全[2] - 大会现场成功启动数智未来高质量数据集开发者创新大赛 旨在为高质量数据产业发展选拔顶尖技术人才[2] - 一批跨行业的高质量数据集与数据标注合作成果集中亮相 标志着高质量数据集建设正从顶层设计加速走向产业实践的深水区[2] 区域产业布局与企业动态 - 南京已集聚超3000家数据企业 形成完整产业链 江苏国际数据港构建起可用不可见 可控可计量的数据流通机制 为能源企业提供跨境数据支持[3] - 国机集团二级总部国机数科落户徐庄高新区 投资30亿元人民币推进农机云和机械装备行业云两朵国家行业公有云建设[4] - 国机数科通过人工智能技术带动中国机械装备产品出海 助力北斗定位系统走出去 拓展海外粮源[4]
37岁天才华裔,问鼎「最年轻亿万富豪」
搜狐财经· 2025-10-10 14:17
公司融资与估值 - Surge AI即将获得10亿美元首轮融资,融资后估值或将升至约240亿美元 [1] - 创始人Edwin Chen持有公司75%股份,其身家随之升至180亿美元 [1] - 公司成立5年,0融资,完全依靠自有资金运营 [7][11] 创始人背景与公司文化 - 创始人Edwin Chen,37岁,华裔,毕业于麻省理工学院,曾在谷歌、脸书、推特等公司任职 [3][9] - 公司文化强调“反硅谷”理念,定下三条铁律:不融资、不烧钱、不接简单订单 [11] - 创始人拒绝1000亿美元的收购报价,并将典型风投支持的初创公司描述为“快速致富的计划” [7][11] 公司业务模式与市场定位 - Surge AI是一家数据标注公司,为生成式AI大模型提供“干净、精准”的训练数据 [5] - 公司采用人机协同的标注方案:由AI生成并标注数据,再由人类评估表现,区别于旧式低报酬人力标注模式 [7] - 公司定位为“高质量标注”路径,主打质量与专家匹配,与主打规模自动化的竞争对手Scale AI形成差异化 [10] 财务与运营表现 - 公司2024年营收12亿美元,超过竞争对手Scale AI同期的8.7亿美元营收 [7] - 公司几乎从创立首日就实现盈利,产品上线不到12个月营收突破八位数 [3][11] - 公司员工仅250名(包括全职、兼职和顾问),客户包括谷歌、Meta、微软、Anthropic、Mistral等巨头 [7] 行业地位与客户关系 - 数据标注公司被业内称为AI产业的“卖铲人”,卡住了AI的数据入口 [5] - 仅Meta一家公司,其生成式AI部门去年在Surge AI的服务上支出超过1.5亿美元 [7] - 公司因“隐私优先、安全第一”的架构,成为医疗、政府等重视AI伦理与数据治理机构的首选供应商 [11] 技术创新与人才策略 - 公司搭建了“Surge Force”精英网络,标注员需通过专业背景审核及5道试写题目考核,标准严苛 [12] - 公司聘请斯坦福、普林斯顿和哈佛的教授训练AI,旨在让AI学会“人类的复杂性、人性的丰富性” [10] - 创始人强调“AGI不会从一堆错误数据中诞生”,公司致力于解决复杂问题并提供高质量数据代码输入 [12] 行业背景与发展趋势 - AI行业涌现一批年轻创业者,如Perplexity估值200亿美元,Mistral AI估值120亿欧元 [13] - 华人在全球AI创新中成为中坚力量,在《时代》2025全球百大AI人物中占据显著席位 [13] - 中国本土AI领域也有一批90后创业者崛起,如彭志辉、宋亚宸、杨植麟等 [14]
37岁,他登顶今年最年轻富豪
首席商业评论· 2025-10-02 12:01
公司概况 - Surge AI正进行首轮融资,融资额10亿美元,估值达240亿美元(约1712亿元人民币)[4] - 公司成立五年未对外融资,但年营收已超10亿美元[4] - 创始人Edwin Chen持有75%股份,身家达180亿美元,成为福布斯美国最年轻亿万富豪[4][7] 业务模式与行业地位 - 主营业务为AI数据标注服务,属于AI产业链中"卖铲子"环节[6] - 数据标注是AI模型训练的刚性需求,专注于提供高质量数据[6][10] - 客户涵盖OpenAI、Anthropic、谷歌、微软、Meta等头部AI公司[10] - Meta生成式AI部门去年在Surge AI服务上支出超1.5亿美元[10] 创始人背景与创业历程 - 创始人Edwin Chen为85后华裔,毕业于麻省理工学院,曾在对冲基金、Twitter、谷歌、Facebook工作[9] - 创业灵感源于工作中发现数据标注行业存在巨大痛点[9] - 公司首个版本仅用一个月开发,上线12个月内实现八位数营收[9] 行业竞争格局 - 主要竞争对手Scale AI获Meta投资后估值超290亿美元[6] - Scale AI前创始人Lucy Guo因持有5%股份成为最年轻白手起家女亿万富豪[6] - 数据标注行业被称为"赛博富士康",但技术护城河在于处理复杂标注任务的能力[6][10] AI行业融资与估值动态 - AI搜索引擎Perplexity估值达200亿美元(约1425亿元人民币),累计融资15亿美元[12] - 法国初创公司Mistral AI估值120亿欧元(约1000亿元人民币),成立一个月即融资1亿美元[13] - 二级市场中英伟达、寒武纪等AI概念股表现突出,寒武纪市值一度突破6000亿元[13]