Workflow
数据标注
icon
搜索文档
海天瑞声(688787):AI数据领军企业,全球化布局打造第二成长曲线
东吴证券· 2025-06-22 16:09
报告公司投资评级 - 首次覆盖,给予“买入”评级 [1][57] 报告的核心观点 - 海天瑞声是A股稀缺的专注提供AI训练数据解决方案的领军企业,未来有望持续获得互联网、央国企等客户订单,深度受益于AI大模型开发迭代和应用落地 [57] - 预计公司2025 - 2027年营收分别为3.45/4.83/6.44亿元,归母净利润分别为0.32/0.56/0.91亿元 [1][57] 根据相关目录分别进行总结 国内AI训练数据解决方案领军企业 - 海天瑞声是我国最早从事AI训练数据解决方案提供商之一,为AI企业、研发机构提供AI数据集及服务,业务涵盖智能语音、计算机视觉、自然语言等核心领域,覆盖全球超200个主要语种及方言 [13] - 公司股权结构相对稳定,董事长贺琳为实控人,管理层技术实力强,中移投资是首发前股东之一,公司与中国移动保持紧密战略协同 [14] - 公司业务按训练数据类型分为智能语音、计算机视觉、自然语言等,盈利模式有定制服务、标准化产品、训练数据相关的应用服务三类 [16][17] - 2024年大模型技术加快发展,公司高毛利的数据集产品收入占比提升,营收2.37亿元,同比增长39%,归母净利润1134万元,扭亏为盈 [22] 数据标注产业迎来政策催化,大模型加速成长 - 2025年1月四部门发布意见,提出到2027年数据标注产业规模年均复合增长率超20%;七大试点城市带动数据标注行业相关产值超83亿元 [30][31] - 大模型驱动数据需求剧增,AI大模型对数据集需求从“通用知识”向“专业知识”延伸拓展,带动数据标注市场需求,预计2025年中国数据标注市场规模有望突破100亿元 [32][36][37] - 品牌数据服务商和需求方自建团队为主,市场集中度有所提升 [39] 从Scale AI看海天瑞声的成长曲线 Scale AI:从数据标注到应用落地,服务大厂和政府客户 - Scale AI从单一数据标注转型为提供端到端的AI解决方案,产品分数据标注、管理和评估、自动化、合成4大类 [40] - 2024年以138亿美元估值完成10亿美元融资,2025年获Meta 143亿美元投资,估值达290亿美元 [43] - 客户群体广泛,2024年营收约8.9亿美元,预计2025年超20亿美元;重视政府合作,由数据标注深入到AI模型应用落地;外包人工标注团队,提升自动化标注水平 [45][46] 海天瑞声:全球化布局,加强政府和产业合作 - 2024年境外收入同比增长89.53%至1.14亿元,在新加坡设立控股公司拓展海外交付基地 [47] - 已和多地政府合作成立合资公司,布局数据标注基地全周期运营;将在人工智能语料库建设等领域加大投入 [47][49] - 截至2024年末提供超9500次/个定制或标准化训练数据集;2025年携DeepSeek行业智能体解决方案亮相大会,从数据标注拓展AI应用落地 [49][50] 盈利预测与估值 - 预计2025 - 2027年智能语音业务收入增速为40%/35%/30%,毛利率稳定在75%;计算机视觉业务收入增速为60%/50%/40%,毛利率稳定在38%;自然语言业务收入增速为60%/50%/40%,毛利率维持60% [56] - 预计2025 - 2027年营收分别为3.45/4.83/6.44亿元,同比增长46%/40%/33%,归母净利润分别为0.32/0.56/0.91亿元,同比增长180%/76%/63%,对应EPS分别为0.53/0.92/1.50元 [57] - 选取易华录、星环科技、拓尔思作为可比公司,可比公司2025年PS均值为15倍,给予海天瑞声“买入”评级 [57]
80后华人零融资创业:1/10人力营收规模超Scale AI,谷歌OpenAI大模型的“秘密武器”
36氪· 2025-06-21 08:02
公司概况 - Surge AI由80后华人埃德温·陈(Edwin Chen)于2020年创立,定位高端数据标注服务,客户包括谷歌、OpenAI、Anthropic等科技巨头 [2][3] - 公司2024年营收达10亿美元,超过竞争对手Scale AI的8.7亿美元,且未进行外部融资 [2][5] - 员工数仅110人,约为Scale AI的1/10,但营收规模更高 [3][7] 商业模式 - 采用高定价策略,收费是Scale AI的2-5倍,以高质量服务著称 [2][6] - 主营数据标注业务,雇佣外包工作人员对AI模型响应进行评分,编写编程、数学、法律等领域的问题和答案 [6] - 子公司Data Annotation Tech提供灵活工作模式,员工起薪为每小时20美元 [6] 创始人背景 - 创始人埃德温·陈曾在MIT学习语言学和数学,并在Facebook、Dropbox、Google、Twitter担任机器学习工程师 [8] - 在Facebook工作期间,因数据标注质量差的问题萌生创业想法 [8] - 2020年离开Twitter后创立Surge AI,初期用自己的积蓄资助公司 [9] 技术优势 - 专注于语言建模,与OpenAI合作微调模型,避免产生有害回应 [9] - 客户反馈公司能快速生成高质量数据,但内部流程保密 [10] - 采用多种技术确保标注质量,如随机插入无正确答案的问题、多标注人员达成一致等 [10] 行业机遇 - Meta投资Scale AI后,OpenAI等公司取消与其交易,Surge AI有望接住新机遇 [14] - 公司凭借高端定位和零融资高收入模式,超越Scale AI的营收规模 [14] 挑战 - 面临员工诉讼,外包员工指控公司违法经营 [12] - 产能饱和,客户需承诺投入数百万美元才能承接项目 [12] - 客户压价,如谷歌与更多供应商合作以降低价格 [13] - 技术替代风险,如蒸馏技术可能减少对人工标注的需求 [13]
Meta巨额投资Scale AI引连锁反应:AI数据标注市场需求激增
智通财经网· 2025-06-19 15:39
Meta对Scale AI的投资 - Meta宣布对AI数据标注公司Scale AI投资143亿美元,收购49%股权,使Scale AI估值超过290亿美元 [2] - Scale AI首席执行官Alexandr Wang将加入Meta核心研发团队,领导Meta"超级智能"团队 [2] - 该交易是AI领域重磅交易,可能改写AI数据标注领域的竞争格局 [3] 行业反应与竞争格局变化 - Meta的投资引发云计算与AI科技领域大客户对其他AI数据标注服务提供商需求激增 [2] - Scale AI竞争对手如Snorkel AI、Labelbox等公司客户兴趣与需求出现激增 [3] - Labelbox表示需求"前所未有",预计将获得更多业务 [4] - OpenAI正在逐步减少对Scale AI数据标注服务的依赖 [1][5] Scale AI公司概况 - Scale AI创立于2016年,早期为机器学习系统提供数据标注服务 [7] - 公司2024年营收约8.7亿美元,同比增长160%,新增业务规模超过15亿美元 [4] - 公司此前在2024年最新一轮融资中估值约140亿美元 [7] - Scale AI已成为AI三大支柱中数据领域的绝对领导者 [7] 行业趋势与影响 - AI数据标注领域竞争愈发激烈,客户寻求服务提供商多元化 [1][8] - 数据工作长期被忽视,该交易象征行业开始认识到人工数据训练对AI大模型的重要性 [9] - 大型科技公司通常与多家数据服务供应商合作,以建立并微调其AI大模型 [8] Meta的战略考量 - 投资Scale AI有望帮助Meta打造"杀手级"AI应用 [11] - Scale AI被视为Meta"AI护城河"最后一块关键拼图,与算力、大模型形成三位一体 [11] - 该投资可能大幅提升Meta人工智能相关业务敞口,为股价带来积极催化剂 [10]
扎克伯格豪掷150亿美元,投资28岁华裔“天才少年”
第一财经· 2025-06-15 00:01
Meta收购Scale AI交易分析 交易概况 - Meta以148亿美元收购Scale AI 49%无投票权股份 创公司历史第二大交易规模[1] - 交易核心为Scale AI创始人亚历山大·王加盟Meta 或将领导"超级智能"部门[1] - Scale AI估值从140亿美元跃升至290亿美元 涨幅107%[3] 标的公司背景 - Scale AI由19岁MIT辍学生亚历山大·王创立 获英伟达、亚马逊、Meta等巨头投资[3] - 主营业务为AI数据标注 客户包括谷歌、微软、OpenAI等 2024年营收8.7亿美元[3][4] - 谷歌年采购额达1.5亿美元 占其营收比重约17%[4] 战略动机 - Meta因Llama 4模型表现不及预期 急需强化AI竞争力[3] - 通过人才收购获取顶尖技术团队 加速尖端模型开发[1][3] - 数据标注能力可提升大模型训练效率 形成协同效应[3] 行业竞争影响 - 竞争对手Labelbox预计将承接"数亿美元"流失客户[5] - Handshake公司需求一夜增长200%[5] - OpenAI表态将维持多供应商策略 避免创新受阻[5] 监管风险 - 49%持股比例可能规避反垄断审查 但参议员沃伦已呼吁调查[6][8] - 与微软收购Inflection AI类似 存在"人才收购"争议[7] - 美国司法部正调查谷歌类似交易 或形成监管先例[7] 客户流失风险 - 核心客户谷歌等担忧数据中立性 考虑更换供应商[3][5] - 大客户集中度高 单一大客户流失可能造成重大损失[4][5] - Scale AI声明将保持数据独立 但市场反应负面[3][5]
扎克伯格豪掷150亿美元,投资28岁华裔“天才少年”
第一财经· 2025-06-14 23:42
Meta收购Scale AI交易分析 交易核心信息 - Meta以148亿美元收购Scale AI 49%无投票权股份 创公司历史第二大交易规模 [1] - 交易包含创始人亚历山大·王加盟Meta并可能领导"超级智能"部门 28岁华裔创始人是收购主要目标 [1] - Scale AI估值从交易前140亿美元跃升至290亿美元 [2] 标的公司业务与客户结构 - Scale AI主营数据标注业务 应用于聊天机器人、自动驾驶等AI领域 [2] - 2024年营收8 7亿美元 核心客户包括谷歌(年消费1 5亿美元)、微软、OpenAI、xAI等 [3] - 收入高度集中 谷歌单客户贡献占比达17% 客户流失将造成重大损失 [3] 行业竞争格局变化 - Meta收购动机源于Llama 4模型未达预期 需通过整合Scale AI技术追赶竞争对手 [2] - 竞争对手Labelbox预计从Scale AI流失客户中获取"数亿美元新收入" [3] - 同业Handshake需求在消息公布后单日增长200% [4] 监管与反垄断争议 - 交易结构设计为49%少数股权 理论上规避反垄断审查 [6] - 参议员沃伦质疑交易可能非法压制竞争 呼吁FTC调查 [7] - 历史案例显示微软收购Inflection AI后FTC调查陷入停滞 反映监管执行不确定性 [6] 客户中立性质疑 - 大客户担忧Meta入股导致数据外流风险 可能转向竞争对手 [2] - OpenAI表态维持多供应商策略 避免生态破坏和创新减缓 [3] - Scale AI声明强调持续保护客户数据 维持政府和企业合作能力 [2]
入股Scale AI,扎克伯格为何豪掷150亿美元投资数据标注公司?
第一财经· 2025-06-14 17:54
交易概况 - Meta以148亿美元收购Scale AI 49%无投票权股份 创下公司历史第二大交易规模 [1] - 交易核心条款包括Scale AI创始人亚历山大·王加盟Meta并可能领导"超级智能"部门 [1] - 交易后Scale AI估值从140亿美元跃升至290亿美元 [2] 行业竞争格局 - 科技巨头在AI大模型领域激烈竞争 Meta因Llama 4表现未达预期面临投资人压力 [2] - Meta通过收购Scale AI及吸纳创始人试图提升尖端模型开发能力 [2] - 数据标注行业竞争对手Labelbox预计将从Scale AI流失客户获得数亿美元新收入 [3] - 竞争对手Handshake在交易消息公布后需求一夜增长两倍 [4] 客户关系影响 - Scale AI核心客户包括谷歌(年消费1.5亿美元)、微软、OpenAI和xAI 2024年营收8.7亿美元 [3] - 大客户担忧Meta持股导致数据外流风险 谷歌等考虑终止合作 [1][2] - OpenAI CFO强调多供应商策略 警告行业收购可能减缓创新 [3] 监管风险 - 49%持股比例理论上不触发反垄断审查 但可能因竞争对手投诉引发调查 [5] - 美国FTC此前已调查微软类似"人才收购"Inflection AI案例 目前进展停滞 [6] - 参议员沃伦公开呼吁反垄断机构审查Meta交易是否压制竞争 [6] 商业模式特点 - Scale AI主营AI数据标注业务 服务覆盖聊天机器人和自动驾驶等领域 [2] - 收入高度依赖生成式AI模型构建者 客户集中度风险显著 [3] - 公司声明强调保持数据中立性 维护与政府及企业合作能力 [2]
给AI打工的人,迷失在数据标注里
虎嗅APP· 2025-06-14 11:23
行业趋势 - AI数据标注行业呈现两极分化现象,既有高薪吸引大量求职者,也存在从业者对未来发展的普遍焦虑[5] - 大模型开发从参数竞赛转向场景落地,导致标注岗位需求从批量放量转向垂直化、专业化[5] - 2024年数据标注产业用工需求企业数量从2023年457家激增至1195家,预计2025年中国AI基础数据服务市场规模突破120亿元,CAGR达47%[26] 职业分层 - 基础层:自动售货机标注以计件制为主(0.04-0.1元/单),依赖体力与注意力,日薪120-500元[7][20] - 中间层:大模型输出结果评分要求985/211硕士学历,计件单价3-7元,需理解动态评价体系但缺乏成长性[8][10][11] - 高层:大模型评估岗位月薪9-17K(外包)至15-25K(正式),涉及流程管理及跨团队协作,具备一定技术壁垒[12][20] 技术替代 - 成熟文本模型中AI合成数据已替代80%人工标注,自动售货机等简单标注将率先被取代[16][24] - 苹果、特斯拉等企业因自动标注技术改进已裁撤相关团队,显示技术替代加速[25] - 微调阶段(SFT)和强化学习(RLHF)仍依赖人工标注,但头部企业倾向用模型合成次优数据控制成本[16] 企业动态 - 字节跳动2024年AI投入达800亿元,2025年计划翻倍至1600亿元[17] - 阿里巴巴宣布未来三年投入超3800亿元建设云和AI基础设施[17] - 头部企业普遍采用外包/众包模式降低标注成本,兼职标注师时薪仅30-60元[17][18] 人才结构 - AI行业呈金字塔分布:标注层(专科)、应用层(本科)、微调层(硕士)、基础模型层(博士)[23] - 职业晋升通道狭窄,标注师难以突破学历壁垒进入核心算法岗位[22][23] - 部分从业者通过跨领域学习(如廖仔从设计转型AI)实现薪资增长(3K→13K/月)[4][28]
给AI打工的人,迷失在数据标注里
创业邦· 2025-06-14 11:07
数据标注师职业现状 - 数据标注师职业被纳入国家职业分类目录 但前景争议大 从业者既面临高薪吸引又担忧被AI取代 [9] - 行业需求从批量放量转向垂直化 专业门槛提升 出现分层现象 [10] - 典型从业者案例:廖仔从3K月薪设计师转型为13K大厂外包标注师 苏打985硕士尝试后因缺乏成长性放弃 [6][7][8] 数据标注工作分层 - 基础层:自动售货机标注 计件收费0 04-0 1元/单 日薪120-500元 考验体力与注意力 [12][36] - 中间层:大模型输出结果评分 计件3-7元/单 需理解复杂评价体系 时薪30-60元 [17][19][34] - 高层:大模型评估鉴定 月薪9-17K 需管理流程与跨团队沟通 具备自主性 [20][36] 行业技术链条与成本结构 - 模型训练分预训练 微调 强化三阶段 标注师主要参与后两个阶段 [24][26] - 头部企业年投入超千亿 但人工标注多采用外包形式以控制成本 [33] - 人工标注数据质量优于AI生成 但企业更倾向使用次优的合成数据以降低成本 [30][32] 职业发展困境 - 从业者缺乏技术壁垒 难以形成个人竞争优势 易被替代 [35] - 行业呈金字塔结构 标注师位于底层 向上突破需顶级学历背景 [40][42] - 模型能力提升后 80%文本标注工作已被AI替代 海外已出现裁员案例 [43][45] 行业发展趋势 - 2024年企业战略转向场景落地 基础标注需求压缩 垂直领域需求增长 [48] - 预计2025年中国AI数据服务市场规模达120亿元 CAGR47% [48] - 需求增长主要来自新场景 而非从业者职业通道拓宽 [49] 头部企业动态 - 字节跳动2024年AI投入800亿 2025年计划1600亿 [33] - 阿里宣布未来三年投入3800亿建设云与AI基础设施 [33]
质疑苹果,效仿苹果?马斯克的X也开始搞抽成了
搜狐财经· 2025-06-09 20:49
X公司估值与财务状况 - 2022年埃隆马斯克以440亿美元收购X(前Twitter),但到2023年秋季估值已缩水至190亿美元,不足收购价一半 [1] - 2024年冬季参与X收购的富达进一步下调持股估值 [1] - 收购时除现金和股票外,还向银团申请130亿美元贷款,每年利息支出高达12亿美元 [3] X公司战略调整与API收费模式变更 - X近期变更API使用协议,从每月固定收费(最低42000美元)改为收益分成模式,根据第三方开发者收益抽成 [3] - 变更原因是大语言模型兴起重塑数据处理方式,新模式旨在创造公平竞争环境并推动增长创新 [5] - 此前X提供三种API套餐:42000美元/月访问5000万条推文、125000美元/月访问1亿条、210000美元/月访问2亿条 [10] xAI与X合并的战略意义 - 2024年3月xAI以全股票交易收购X,xAI估值800亿美元,X估值330亿美元 [6] - 合并后双方整合数据、模型、算力和人才,xAI获得海量数据,X借助Grok 3模型提升用户体验 [8] - X用户成为免费数据标注员,平台产生的文本、图像和视频数据为Grok模型提供实时动态训练素材 [8] 收费模式调整的商业逻辑 - 新抽成模式对中小开发者更友好(月营收低于14万美元时成本低于原模式),但对OpenAI等大型AI厂商更不利 [11] - 类似苹果App Store的30%抽成逻辑,通过"损有余补不足"实现收益最大化 [13] - 深层原因是借助AI热潮为X减轻债务压力,掩盖财务困境 [13] 行业竞争格局 - Meta、谷歌等巨头能快速追赶OpenAI,核心优势在于通过旗下产品获取海量数据 [8] - 数据被视为AI时代的"石油",X通过控制API访问限制第三方AI厂商数据获取 [10][13]
AI招聘平台Mercor创始人最新访谈:招聘中AI如何评估人、五年后人类还能做什么
IPO早知道· 2025-06-07 07:47
Mercor公司概况 - Mercor由三位21岁的Thiel Fellows于2023年创立,专注于AI招聘平台开发,通过AI技术自动化简历筛选、候选人匹配、面试和薪酬管理,旨在提升招聘效率并减少人为偏见 [2] - 2024年2月完成1亿美元B轮融资,估值达20亿美元,由Felicis领投,Benchmark、General Catalyst和DST Global等跟投 [2] - 业务已从AI招聘扩展到AI模型评估和数据标注领域,为AI实验室提供专家型人才服务 [3] AI招聘技术进展 - 在文本评估场景(简历筛选、面试文字分析)中,AI表现已接近或超越人类,但在多模态任务(如情感判断)仍有不足 [4][7] - AI招聘的核心优势在于能整合丰富上下文数据(如播客观点、会议记录),显著降低传统评估成本并提升效率 [4] - 未来分工趋势:AI主导评估环节,人类专注于"推销"岗位(如团队氛围沟通)以优化候选人体验 [4][11] 数据标注市场转型 - 数据标注市场正从低门槛众包转向高质量专家型标注,因当前AI模型需专业人才设计复杂评测来验证性能 [3][23] - Mercor通过平台快速匹配AI实验室与领域专家,满足短期合同制标注需求,形成差异化竞争力 [3][8] - 传统SFT/RHF数据标注预算将减少,专家协作式标注需求预计增长一个数量级 [24][48] 商业模式与战略 - 采用端到端服务模式,直接连接全球劳动力供需两端,初期聚焦合同工市场后逐步扩展至全职招聘 [26][36] - 核心网络效应体现在:客户需求越强,平台吸引的优质候选人越多,进而提升匹配效率 [25][26] - B轮融资资金将用于产品研发(推荐激励、消费级产品)、市场扩张及模型预测能力优化 [41] 行业未来展望 - 基础模型领域将呈现"通用API大宗商品化+垂直领域深度定制"格局,应用层公司更具定价权 [42][43] - 人类未来角色将转向创造评测标准,指导AI学习尚未掌握的技能,而非重复执行任务 [24][34] - 软件工程师需求弹性大,AI工具提升生产力后可能刺激更多岗位而非替代 [36][49] 技术应用案例 - 内部招聘中AI面试官对非高管岗位的预测准确率超过人类面试官,转正率提升32% [32] - 通过分析候选人非传统信号(如兴趣驱动项目、留学经历)发现人类易忽略的潜力指标 [11][15] - 采用动态评测设计(如深度背景提问)防止候选人"刷分",保障评估真实性 [15][17]