Workflow
数据标注
icon
搜索文档
3位00后,估值700亿
36氪· 2025-10-28 20:09
22岁辍学创业、24岁干出百亿美金估值独角兽是什么概念? 智东西10月28日消息,今日,美国AI招聘独角兽Mercor官宣拿下2.5亿美元(折合人民币约18亿元)新融资,估值达到100亿美元(折合人民币约710亿 元),是其今年2月20亿美元(折合人民币约142亿元)估值的5倍。 这家成立于2023年的AI创企,如今合计融资达3.5亿美元(折合人民币约25亿元),已将OpenAI、Anthropic等世界前五大AI实验室纳入客户名单,17个 月营收运行率从1美元增长到5亿美元(折合人民币约36亿元)。 而创立这家AI独角兽的正是三位大二辍学的00后:CTO阿达什·希雷玛斯(Adarsh Hiremath)、CEO布兰登·富迪(Brendan Foody)、COO苏尔雅·米德哈 (Surya Midha)。他们分别于2023年从哈佛大学、乔治城大学辍学合体创业。 ▲CTO希雷玛斯、CEO富迪、COO米德哈(从左到右) 帮助他们赚得第一桶金的业务是AI招聘,其通过AI筛选简历,快速为候选人匹配岗位。今年2月,基于这一庞大的专业人才网络,Mercor开辟了数据标 注、大模型评估业务,也就是与现有的专家人才签订合同, ...
泰安打造全流程数据标注生态圈
大众日报· 2025-10-27 11:26
近年来,泰安数据标注产业已形成良好的产业基础:一家头部企业引领、两大标注集群并进、一条 完整产业链初具规模。其中,作为数字中后台运营服务行业的领头羊,泰盈科技依托行业资源,迅速打 开数据标注市场。百度智能云(泰山)人工智能基础数据产业基地与菲利信(泰山)数字经济产业基地 相继落地,构建起泰安的两大数据标注集群。目前,泰安已集聚30余家数据标注企业,形成从上游数据 采集与治理,中游数据标注与加工,到下游人工智能训练与应用的全流程产业链条。 数据标注,就是为原始数据如图像、文本、音频、视频等打上有意义的标签,让机器学习模型能 够"读懂"并从中学习。近日,在菲利信(泰山)数字经济产业基地,键盘敲击声此起彼伏,标注员们紧 盯屏幕,对各类数据进行精准标注。公司自主研发的采标一体化数据标注平台,界面简洁、操作便捷, 能够高效管理项目、标注员与质检流程,支持图像、文本、语音及内容审核等多种业务类型。 从美妆时尚、旅游美食等泛生活分享,到二次元、游戏、娱乐等多元兴趣领域,小红书平台逐渐成 为当代年轻人的"线上兴趣班"。这些内容的呈现与分发,离不开精准的数据审核与标注。在泰安,一家 人工智能企业——山东菲利信数字科技有限公司( ...
大连数字和软件服务交易会启幕
辽宁日报· 2025-10-25 08:59
行业活动概览 - 2025大连数字和软件服务交易会于10月24日启幕 主题为“数智赋能产业 创新引领未来” [1] - 交易会重点围绕人工智能 数据标注 工业互联网 车联网 低空经济 跨境电商六个前沿赛道开展分项活动 [1] - 交易会期间有8个数字经济重点合作项目签约 涵盖数字技术研发 软件创新应用 产业生态构建等多个核心领域 [1] 产业生态规划 - 大连高新区发布数据标注 人工智能 工业互联网 车联网等九大产业园生态规划 [1] - 大连市数据标注产业园揭牌并正式开园 集公共服务平台 人才培训中心 企业办公空间等功能于一体 [1] - 数据标注产业园专注于智能驾驶 医疗健康 具身智能 海洋经济 金融监管等领域 [1] 产业发展目标 - 数据标注产业园预计到2027年形成近万人规模的区域性数据服务枢纽 [1] - 目标是将该产业园打造成为国内最具影响力的数据标注产业基地之一 [1] 项目落地机制 - 交易会配套组织多项产业对接考察活动 围绕落地场景深入对接 [1] - 建立项目落地跟踪机制 以确保合作意向转化为实际成果 放大数交会长期效应 [1]
在美国,有多少硕博被当做鉴黄师?
虎嗅APP· 2025-10-19 21:20
AI行业劳动力现状 - AI行业资本投入巨大,出现一亿美金挖人才的现象[5] - 普通用户在不知情下成为AI训练免费劳动力,例如通过短视频反馈和人机验证为算法提供数据[8][9] - AI评估员和数据标注员构成行业重要但被忽视的劳动力群体[13] AI数据标注工作内容与要求演变 - 早期视觉模型数据标注是纯体力活,如图片拉框打点,计件付费且规则苛刻,框一个文本0.03元,日入150需框5000条[16] - 大语言模型评估需判断力、审美和领域知识,工作内容包括评估答案准确性、文学风格和伦理合规性[19] - 岗位要求显著提高,需硕士、博士或专业领域背景人员,如作家、教师、物理学博士[20][21] - 国内标注岗位要求本科学历,部分需985/211背景或特定专业知识[26] AI劳动力薪酬与待遇问题 - Google AI评估员时薪16~21美元,月薪约3000美元,低于美国联邦救济金水平[22] - Google AI工程师年薪10万美元起,远高于评估员薪酬[23] - 国内AI数据标注岗位薪资约7k~10k人民币,但职业发展受限,知识被一次性榨干[28][29] - 外包员工工作不稳定,项目结束即失业,绩效与正确率挂钩(低于90%取消绩效),工资可能拖欠[32][33] 外包模式与全球劳动力压榨 - 大厂通过外包满足数据标注需求,形成金字塔结构,顶层为算法天才,底层为高学历小时工[29] - 外包链条长,甲方包给乙方后层层转包至二包、三包,下游工作室为利润压缩规范[31] - 肯尼亚工人以低于2美元时薪标注暴力、色情内容,导致心理创伤[37] - 亚马逊无人超市依赖印度员工手动确认摄像头数据,多伦多送餐机器人由菲律宾工人远程操控[37] 行业价值观与劳动力尊重 - 硅谷存在技术至上、文科无用观念,轻视人文领域劳动价值[25] - AI发展依赖非计算机知识(如文学、哲学)确保模型伦理和品质,但相关劳动者未被充分重视[25] - 行业需尊重知识和劳动,避免高科技成为压榨工具,否则AI难以实现解放人类生产力的目标[39]
在美国,有多少硕博被当做鉴黄师?
虎嗅· 2025-10-19 18:55
AI行业人才投入与薪酬结构 - 资本圈投入巨大资金挖掘AI人才,金额可达一亿美金[1] - AI工程师在Google总部年薪可达10万美元以上,属于高薪岗位[25] - 与高薪技术岗位形成鲜明对比的是,AI评估员时薪仅为16-21美元,月薪约3000美元[23] AI数据标注与评估工作内容演变 - 早期视觉模型数据标注为纯体力劳动,如图片拉框打点,单文本框报酬0.03元人民币[15][16] - 大语言模型评估工作需判断答案准确性、资料引用准确性、语气专业性及文学创作质量,要求评估师具备判断力、审美和领域知识[20] - 数据标注工作存在严格规则,如车辆类型精准区分、标注误差不超过3像素,返工现象普遍[17] AI人力资源构成与资质要求 - Google承包商招募的AI评估员包括经验丰富的作家、硕士学历教师和物理学博士[22] - 国内数据标注岗位要求从大专提升至本科,部分岗位明确要求985/211院校及特定领域专业知识[32] - 具有211本985硕背景的应届生从事数据标注工作,薪资范围在7千至1万元人民币[34] 外包模式与劳动力管理现状 - 大厂通过外包满足数据标注大量、紧急的需求,避免组建正式团队的高成本[35] - 项目存在多层转包现象,从甲方到乙方再到二包、三包甚至四包[38] - 外包公司管理不规范,存在项目突然终止、加班无补偿、绩效与正确率挂钩(低于90%取消绩效)等问题[39][40] 全球AI产业链底层劳动者状况 - 肯尼亚工人以低于2美元时薪处理暴力、色情等有害内容,导致严重心理创伤[45] - 亚马逊无人超市Amazon Go依赖1000多名印度员工手动确认摄像头画面[46] - 多伦多送餐机器人由菲律宾工人在夜间远程操控,体现人类劳动力替代智能技术的成本优势[47] AI产业发展模式与社会影响 - 当前AI产业形成金字塔结构,顶层为少数算法天才,底层为大量高学历数据标注员[36] - 全球AI产业存在路径依赖,通过层层转包和劳动力压榨维持运转[43] - 科技公司更倾向于低成本使用人类执行标准化任务,而非开发完全自主的智能系统[47]
发展数据标注技术,把数据“原油”炼成“汽油”
人民日报· 2025-10-15 14:46
行业政策与规划 - 国务院提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委等部门提出到2027年数据标注产业年均复合增长率超过20%[2] - 国家数据局已指导7个城市建设数据标注基地,截至今年上半年带动相关产值超过83亿元[2] 产业定义与重要性 - 数据标注是通过给文本、语音、图片、视频等数据打标签,将人类知识转化为计算机语言的关键工艺[1] - 数据标注是人工智能高质量数据集建设的关键环节,能有效提升垂类大模型的专业领域性能[1] - 高质量数据可加速人工智能赋能千行百业,如在分子药物研发和工业质检场景中标记关键信息[2] 市场需求与增长 - 在人工智能大模型和政策驱动下,数据标注需求爆发式增长[2] - 有企业过去一年承接了2000多项数据标注项目需求,预计今年业务量将增长超过30%[2] - 数据标注产业已初步形成覆盖上游数据提供方、中游平台公司、下游服务商的产业链闭环[3] 技术与发展趋势 - 智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注提高效率和准确性[3] - 数据标注产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3] 当前阶段与未来方向 - 数据标注产业还处于初期阶段,需要各方群策群力共同培育产业生态[4] - 各地需加强政策落实和引导,搭建常态化供需对接服务平台[4] - 应用企业需以实际需求驱动数据标注能力体系建设,与标注企业共同开展工具研发和流程优化[4]
发展数据标注技术,把数据“原油”炼成“汽油”(新视点)
人民日报· 2025-10-15 06:12
行业政策与规划 - 国务院于2024年8月印发《关于深入实施"人工智能+"行动的意见》,明确提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委、国家数据局等部门于2024年12月印发《关于促进数据标注产业高质量发展的实施意见》,提出到2027年产业规模大幅跃升,年均复合增长率超过20%[2] - 国家数据局已指导安徽合肥、四川成都等7个城市建设数据标注基地,截至2025年上半年,基地建设数据集524个,服务大模型163个,带动相关产值超过83亿元[2] 行业定义与重要性 - 数据标注是对文本、语音、图片、视频等数据打标签,通过特征提取、分类、注释、标签化等操作,将人类知识转化为计算机可识别语言[1] - 数据标注被誉为将数据"原油"炼成"汽油"的关键工艺,可为数据注入新价值,是人工智能高质量数据集建设的关键环节[1] - 经过标注的高质量数据能有效提升垂类大模型的专业领域性能,加速人工智能赋能千行百业[1] 市场需求与增长 - 在人工智能大模型和相关政策驱动下,数据标注需求呈现爆发式增长[2] - 标贝科技在过去一年承接了2000多项数据标注项目需求,预计2025年业务量将增长超过30%[2] - 数据标注应用场景广泛,包括分子和药物智能研发中对原子、电荷等关键信息标记,以及工业质检中对产品缺陷尺寸、位置、类型等信息标记[2] 产业链与产业生态 - 数据标注产业链覆盖上游数据提供方、中游平台公司、下游服务商,中国已初步形成产业链闭环[3] - 产业集聚带动作用日益凸显,各地加速培育数据标注产业[3] - 产业处于初期阶段,需要加强政策落实和引导,搭建常态化供需对接服务平台,推动行业标准规范建设[4] 技术与发展趋势 - 技术迭代趋势明显,智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注数据,标注员承担关键决策角色以纠正模型错误[3] - 要求提升趋势显著,高质量数据集评判标准更复杂,产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 对象拓展趋势持续,被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3]
19岁,她融资1.2亿
36氪· 2025-10-12 15:58
公司概况 - Serena Ge是一位19岁的华人00后,从滑铁卢大学计算机专业辍学创业,是AI数据公司Datacurve的联合创始人兼CEO [2][3] - 公司成立仅一年,累计融资额达1770万美元(约合人民币1.26亿元) [2][8] - 团队规模约10人,目前仍在招聘中 [5] 创业背景与契机 - 创始人高中时期曾开发攀岩App和青少年效率网页应用,具备早期创业经验 [3] - 在AI独角兽Cohere实习期间发现高质量专家级标注数据的市场缺口,成为创业直接动因 [3] - 2024年因AI智能体项目UncleGPT获得Y Combinator孵化器邀请后选择辍学创业 [3] 商业模式与核心优势 - 公司定位为AI大模型提供高质量的代码数据,破解"缺乏丰富、精心挑选的高质量标注数据"的行业瓶颈 [4] - 采用"赏金猎人"系统Shipd平台,吸引超过1400名程序员通过完成算法、测试等任务挑战获取5-50美元/任务的报酬,已发放赏金超100万美元 [4] - 核心竞争力在于通过游戏化平台提升用户体验和数据标记精准度,而非单纯依赖金钱激励 [4] - 成立两个月即实现收入超过100万美元,客户覆盖超一半基础模型实验室及Facebook、苹果、亚马逊、谷歌等科技巨头 [5] 融资进展 - 近期完成1500万美元A轮融资,由Chemistry VC领投,Y Combinator、Afore Capital、Homebrew等机构及DeepMind、OpenAI、Anthropic等公司投资人参与 [7] - 早期完成270万美元种子轮融资,投资方包括Y Combinator、Pioneer Fund及Coinbase前CTO Balaji Srinivasan [7] - Chemistry VC合伙人评价其为"投资过增长最快的初创公司之一",并在融资后签署公司史上最大合同 [7] 行业定位与竞争格局 - 公司被类比为AI数据领域的"卖铲人",专注于AI三大基石(数据、算法、算力)中的数据环节 [9] - 主要竞争对手包括Scale AI(Meta斥资约150亿美元入股后估值超290亿美元)和Surge AI(正进行10亿美元首轮融资,估值约240亿美元) [10] - 行业存在"有多少人工就有多少智能"的特点,数据标注公司因提供模型训练必需的"干净"数据而具有不可替代性 [8] 00后AI创业潮现象 - 同类00后创业案例频现:Axiom Math完成6400万美元融资(投后估值3亿美元)[11]、Sola Solutions获2100万美元融资[11]、Mercor寻求约百亿美元估值[12] - 国内清华00后创立的机器人公司零次方完成亿元级融资,灵初智能、UniX AI、重隼科技等年轻创始人不断涌现 [13] - 行业观点认为AI降低了创业门槛,00后创业者具备"没有包袱,学习快,动手更快"的独特优势 [14]
19岁,她融资1.2亿
投资界· 2025-10-12 15:42
文章核心观点 - 一场属于00后的AI创业潮正在全球范围内兴起,年轻创业者正以惊人的速度重塑AI未来 [4][13][16] DataCurve公司概况 - 公司由19岁的华人女孩Serena Ge联合创立,成立仅一年已累计融资1770万美元(约合人民币1.26亿元)[4][6][11] - 公司致力于创建高质量的代码数据,为AI大模型提供支持,定位为AI数据领域的“卖铲人” [5][11] - 公司团队规模约10人,成立两个月时收入就超过100万美元 [8] DataCurve商业模式 - 公司通过“赏金猎人”系统Shipd吸引熟练软件工程师完成高难度数据获取任务,平台已有超过1400名程序员 [7] - 每解决一个任务用户可获得5到50美元费用,公司已发放超过100万美元赏金 [7] - 与依赖庞大外包团队的Scale AI不同,公司核心竞争力在于提供良好用户体验,吸引高质量程序员参与 [7][8] - 客户包括超过一半的基础模型实验室以及Facebook、苹果、亚马逊、谷歌等公司 [8] DataCurve融资历程 - 公司完成1500万美元A轮融资,由Chemistry VC领投,Y Combinator、Afore Capital、Homebrew等机构参与 [10] - 更早之前完成270万美元种子轮融资,Y Combinator、Afore Capital、Pioneer Fund等机构支持,Coinbase前CTO参与投资 [11] - 投资人评价其为“投资过增长最快的初创公司之一” [10] AI数据标注行业格局 - 行业存在著名梗:“有多少人工就有多少智能”,数据标注公司被称为“赛博富士康” [11] - 数据、算法和算力是AI三大基石,数据标注公司是数据的“卖铲人” [11] - 竞争对手Scale AI在Meta斥资约150亿美元入股后,估值超过290亿美元 [12] - 华裔Edwin Chen创办的Surge AI正在进行10亿美元首轮融资,估值约240亿美元(约合1712亿元人民币) [12] 其他00后AI创业案例 - Axiom Math完成6400万美元(约合人民币4.6亿元)首轮融资,投后估值3亿美元(约合人民币20亿元),创始人为00后洪乐潼 [14] - Sola Solutions由两位麻省理工00后创立,总计融资2100万美元(约合人民币1.5亿元) [15] - AI标注公司Mercor由三位00后从哈佛及乔治敦大学退学创立,B轮后估值约为20亿美元,正寻求约百亿美元估值 [15] - 国内三个来自清华的00后创立机器人公司零次方,完成天使轮亿元级融资 [15]
37岁1200亿,他登顶今年最年轻富豪
华尔街见闻· 2025-09-29 19:12
Surge AI公司概况 - 公司正进行10亿美元首轮融资 对应估值约240亿美元(约1712亿元人民币)[4] - 公司成立五年未对外融资 但实现年营收超10亿美元[4][7] - 公司创始人Edwin Chen持有75%股份 身家达180亿美元(约1281亿元) 首次入选福布斯美国最年轻亿万富豪[5][12] 业务模式与市场地位 - 主营业务为AI数据标注服务 被比喻为"卖铲子"的刚性需求[7][11] - 客户涵盖OpenAI、Anthropic、谷歌、微软、Meta等全球AI巨头[15] - Meta生成式AI部门去年在公司全流程标注服务上支出超1.5亿美元[15] 创始人背景与创业历程 - 创始人Edwin Chen为85后华裔 毕业于麻省理工学院 曾任职于对冲基金、谷歌、Facebook等机构[4][13] - 创业灵感源于大厂项目外包数据标注质量差 发现行业痛点[13] - 产品上线12个月内实现八位数营收 并抓住大语言模型兴起的风口[14] 行业竞争格局 - 主要竞争对手Scale AI获Meta约150亿美元入股 估值超290亿美元[8] - 竞争对手Scale AI已离职创始人Lucy Guo凭借5%股份成为最年轻白手起家女亿万富豪[8] - 数据标注行业被视为AI基础设施 无论技术如何演进都离不开高质量数据[10][11] AI行业投融资动态 - AI搜索引擎Perplexity获2亿美元融资承诺 估值达200亿美元(约1425亿元)[16] - 法国初创公司Mistral AI即将完成20亿欧元融资 估值达120亿欧元(约1000亿元)[16] - Mistral AI成立一个月凭借7页PPT融资1亿美元 刷新欧洲种子轮纪录[16][17] 二级市场表现 - 英伟达、甲骨文股价创历史新高 A股寒武纪市值突破6000亿元 超越贵州茅台成新任"股王"[17] - A股算力三巨头"易中天"(新易盛、中际旭创、天孚通信)股价五个月内均实现翻倍[18] - 海光信息股价较三年前发行价涨超7倍 与寒武纪、工业富联组成"纪连海"概念[17]