数据标注
搜索文档
海天瑞声20260112
2026-01-13 09:10
涉及的行业与公司 * 行业:人工智能数据服务与数据标注行业 [2] * 公司:海天瑞声 [1] 核心观点与论据 财务表现与增长预期 * 公司预计2026年保持增长势头 [2] * 2025年前9个月境外收入占比超过47%,预计全年维持在45%至50%区间 [4] * 预计2026年收入至少达到5亿元以上 [27] * 2025年相比2024年,大模型厂商的数据需求增长了约20%到30%,预计2026年增幅至少保持相同水平 [15] * 过去多年综合毛利率稳定在65%左右,但2025年前9个月数据表明综合毛利率从65%降至50%,未来预计在50%左右波动,并有望回升至52%-55% [21] 海外市场战略与进展 * 境外收入主要得益于北美等海外市场的显著进展 [2] * 通过并购整合在菲律宾马尼拉建立了1,000多人的标注基地,为国内互联网公司的东南亚业务提供支持 [2][5] * 计划继续扩展东南亚市场,在泰国、印尼或越南建立第二个本地化基地 [7] * 2026年计划增加至少500人,到明年底或后年底预计达到3,000人左右 [13] * 2025年海外基地带来约六七千万收入,2026年预计至少翻倍到1.5亿左右,到明年底或后年底进一步增长至1.5亿以上 [13] * 建立海外基地的战略意义在于通过建立外循环来承接美国头部客户的大型定制订单 [8] 国内市场与客户情况 * 在国内市场主要服务科技互联网领域和G类客户 [2] * 阿里巴巴2025年贡献了3,000万收入,是服务阿里近15年来的峰值,比2024年翻了几倍 [9] * 腾讯表现出强烈兴趣,通过观察竞争对手来确定方向并加大投入 [9] * 快手2025年贡献了1,500万收入 [9] * 每年的客户数量逐年增加,2025年半年报显示拥有约1,200个客户,但其中只有20%左右为活跃客户 [24] * 每年收入大约70%-80%由前20至25名顶级客户贡献,前十名客户平均每个年度贡献千万级别收入 [25] 重点业务方向与行业机会 * **G类数据要素产业化**:2025年表现超出预期,2026年预计继续增长 [4][11] 高质量数据主要存储在央企、国企及政府控制的公共服务器中,占全社会数据存量75%以上 [11] 到2027年年底,全社会Agent普及率需达到70% [11] * **大模型数据需求**:后训练阶段需要高质量数据,通常由行业专家完成 [16] 公司提升内部能力,以便快速触达重点行业专家 [4][16] * **看好的垂直行业**:具身智能、医疗和AI政务 [4][17] 具身智能领域数据采集难度极高,公司内部孵化团队正在开展业务,预计2026年以孵化模式启动 [18] * **AI应用合作**:与苹果、Zoom和Meta等知名科技公司合作,满足其对高质量、多语种数据的需求 [2][6] 公司能力与竞争格局 * **数据治理能力**:被视为确保高质量数据的重要环节,考验数据服务商的综合能力 [4][11][12] 公司结合多年沉淀的know-how与Agent技术,推动AI for Data Governance [12] * **技术门槛**:数据标注技术存在行业和数据类别门槛 [22] 例如医疗领域标注容错空间小,自动驾驶也有类似情况 [22] 语音标注难度最高,其次是文本,再次是视觉 [22] * **核心能力**:依赖于自动化标注能力的提升和特定背景人才的资源调动与培训 [23] * **竞争格局**:低阶数据层面竞争非常激烈,公司自2024年起更加聚焦中端和高端方向,这两个层级竞争相对较小 [26] * **行业地位**:公司是市场上唯一上市的数据标注企业 [27] 作为行业头部公司,经常接到项目线索 [24] 其他重要内容 * 公司积极参与数据跨境政策制定,使得数据出境业务在合规前提下几乎没有障碍 [2][5] * 公司通过半自动化手段提高效率和毛利率 [2][7] * 在标准化产品数据集的存储方面,特别是语音方向,储备是充足的 [14] * 全球供应链端已经储备了几千个供应商,其中60%在国内,40%在国外 [14] * G类业务新型项目初始毛利率大约在44%-45%左右,未来有望通过平台模块成熟化而提升 [20] * 公司从估值角度通常可以获得20倍到30倍的PS估值 [3] * 预计如果估值达到30倍,则市值可达150亿元左右 [27]
贵州首次为数据标注企业发放奖补
搜狐财经· 2026-01-05 09:26
文章核心观点 - 贵州省首次为数据标注企业发放总计730万元奖补资金 旨在通过“免申即享”的创新型政策兑现模式 为数据标注产业注入发展新动能并推动其成为数字经济增长新引擎 [1][2] 政策与行业动态 - 贵州省大数据发展管理局于2026年1月4日召开数据企业座谈会暨政策兑现会 现场为6家优秀数据企业集中发放奖补 [1] - 奖补资金通过“免申即享”机制发放 依托政府数据共享核验系统自动比对认定 实现“政策找企业” 企业无需提交材料即可获得资金 [1] - 后续政策将持续优化2026版细则 扩大“免申即享”范围 并完善园区配套与人才培育体系 助力打造“做标注、到贵州”产业品牌 [2] 公司具体奖补情况 - 世纪恒通因2025年数据标注业务收入首次突破1亿元 获得300万元奖励 [1] - 迦太利华、梦动科技等4家企业因数据标注业务收入突破3000万元 各获得100万元奖励 [1] - 数据宝公司核心团队因技术成果转化新增营收达标 获得30万元补贴 [1] 公司业务发展与规划 - 迦太利华在政策支持下 其数据标注业务收入一年内增长近4倍 已成为公司第三大业务支柱 [2] - 迦太利华计划在2026年组建500人以上的本地标注团队 以吸引更多大客户订单落户贵州 [2]
中科数字生态创新(云南)中心在昆揭牌
新浪财经· 2025-12-24 06:11
公司动态与战略 - 中科数字生态创新(云南)中心在昆明高新区正式揭牌启动运营 [1] - 公司紧密围绕国家“数字中国”战略与云南省“数字政府”建设部署 [1] - 公司致力于在云南开展创新业务统筹、产业资源整合与品牌生态共建 [1] - 公司将积极探索“北上广深研发+云南加工”的跨区域协同模式 [2] - 公司致力于建设支撑人工智能产业可持续发展的可靠“数据粮仓” [2] - 公司将深化产教融合,开发适配产业的实训系统,着力培养高素质技术技能人才 [2] - 公司将利用昆明在跨境数据等方面的独特政策与区位优势,促进数据要素安全高效流通 [2] 行业现状与挑战 - 数据标注是人工智能大模型迭代的关键基石 [1] - 数据标注产业快速成长,但仍面临技术能力与市场需求脱节、行业标准不完善等挑战 [1] - 行业同时孕育着巨大升级空间与发展潜力 [1] 产业发展方向与建议 - 专家建议探索本地化发展路径,构建“数据标注为基础、AI模型为引擎、跨境场景为出口”的特色产业闭环 [1] - 专家建议推动产业从劳动密集型向高附加值“AI增强型”智慧化转型 [1] - 公司计划推动数据标注产业规范化、规模化发展 [2] - 公司计划培育本土数字经济新增长点 [2]
一个入局晚了的数据标注创业者,3个月亏了20万
虎嗅APP· 2025-12-19 22:37
文章核心观点 - AI创业浪潮正加速向三四线城市及县城等下沉市场蔓延,数据标注项目被宣传为低门槛、高回报的“高科技生意”,吸引大量普通创业者入局[4] - 然而,下沉市场的AI数据标注创业存在诸多隐形门槛与陷阱,包括甲方绝对话语权、项目不稳定、利润极低、结算周期长等,导致许多缺乏资源和专业背景的创业者迅速失败[6][7] - 通过一位山东德州创业者的失败案例揭示,在缺乏产业集群和稳定项目来源的三线城市,试图以“人海战术”从事低端数据标注代工难以持续,最终血本无归[8][10] - 创业失败后的转型经历表明,在医疗等具有专业资质门槛的垂直领域进行AI数据相关创业,可能更具竞争力和利润空间,是更可行的生存路径[36][38] 行业生态与产业链 - AI数据标注行业产业链呈金字塔式食物链,车企等甲方将项目给大厂,大厂再层层转包,每一层都剥取利润,最终到达末端小公司的项目单价已被压至极低[22] - 行业存在明显的资源与地域壁垒,简单、标准化、高利润的项目牢牢掌握在头部数据中心或总部“基地”手中,外部小公司只能承接复杂、耗时、利润微薄的“四手”项目[21][22] - 行业结算周期极长,通常为验收开票后两到三个月,最长可达六个月,迫使小公司必须用自有现金流垫付长达半年的运营成本,资金压力巨大[22] - 项目极不稳定且规则多变,甲方常宣称项目长期量大,但往往一两个月后突然中止,或朝令夕改,要求按新规返工,导致小公司前期投入的人力全部浪费[25] - 2024年,受车企销量下滑等因素影响,数据标注行业整体收缩,连手握一手资源的头部公司也开始大规模裁员,例如德州某北京背景的“正规军”公司员工从300多人缩减至不到100人[28] 下沉市场创业挑战 - 创业成本陷阱:尽管部分地方政府提供“免租金”等入驻优惠,但高端写字楼的物业费、空调费等隐性成本高昂,三个月相关费用达七八万元[20] - 人力资源困境:地处郊区、通勤不便(单程40多分钟)导致员工流失率高,招聘对象多为职校毕业生或寻求兼职的宝妈,团队极不稳定[20][26] - 员工效率与产出低下:数据标注工作(如无人驾驶3D点云标注)枯燥且易引发生理不适(“晕3D”),员工日均产值远低于预期,案例中最为努力的员工日产值仅约40元,与甲方承诺的“人均日产值300元”相去甚远[26] - 法律与劳务风险:公司解散时可能面临员工劳动仲裁,产生额外赔偿成本,案例中经调解后赔偿了一名员工3000元[33] 创业失败案例详情 - 创业者背景:45岁,第三次创业,此前从事房地产信息化工程和广告业务,因行业遇冷而寻求转型[10][14] - 创业启动:2024年7月,与合伙人凑集20万元启动资金,在山东德州郊区“京津翼创新转化中心”成立数据标注公司,享受免租金政策,租用300平米办公室及30台电脑[11] - 运营过程:招聘二十余名员工,主要承接无人驾驶数据标注项目,但项目来源不稳定、利润微薄,同时需按月支付员工底薪(德州最低工资标准1850元/月,加补贴后约2000元/月)及高昂运营费用[16][22][24] - 失败结局:运营3个多月后,20万本金耗尽,于2024年10月中旬关闭公司,期间未收到甲方任何回款,也未完整完成任何一个项目[8][10][29][30] 转型方向与启示 - 转向垂直专业领域:创业失败后,创业者利用自身医学背景(持有X光技师执照,有7年医院影像科工作经验),组建4人小团队,转型切入医疗数据标注领域[36] - 垂直领域优势:医疗数据标注核心是审核AI大模型的医学建议准确性,具有专业资质门槛(如要求二线城市以上三甲医院医生资质),竞争相对较小,利润空间可观,时薪可达60至150元,且结算准时[36][37] - 下沉市场新机遇:在医疗、法律等垂直领域,三四线城市的专业从业者反而可能具备竞争优势,因为一二线城市的资深专家通常无暇从事此类基础审核工作[37] - 核心启示:在AI创业浪潮中,试图以低成本人力进行低端代工的模式难以为继,只有依托不可替代的专业知识和资质门槛,才能在特定垂直领域找到生存与发展空间[38]
四中全会精神在基层丨大山深处,数据标注员越来越多
新华网· 2025-12-18 08:18
行业趋势与政策驱动 - 生成式人工智能和数据要素市场化加快推进,高质量数据集需求旺盛,推动数据标注产业发展[3] - 贵州省“十四五”期间数字产业规模年均增速达16.2%,预计到今年底将达到2800亿元左右,其中软件和信息技术服务业收入规模突破千亿元[5] - 国家层面提出全面实施“人工智能+”行动,加强人工智能同产业发展等相结合,抢占产业应用制高点,为数字经济发展提供指引[5] 地方产业发展与规模 - 贵州省大力培育数据标注全产业链,前期已集聚67家数据标注企业,从业人员总人数超过9100人[5] - 贵阳市白云区以贵州省首个数据开发利用加工基地为核心,已建成多个企业特色园区和超8万平方米的白云数据空间产业化基地[3] - 白云区规划数个标注基地,预计将带动超5000人就业[3] 公司运营与扩张 - 南国大数据(贵州)有限公司已在多个市州拥有分公司,目前员工规模超700人,未来有望带动超2000人就业[3] - 公司正与学校建立科研团队,研发自己的标注平台和预标注平台,以更高效地完成数据处理工作[5] - 公司通过产教融合模式,今年超过400名来自合作院校的学生在该企业完成实习,其中约20%的人通过考核留任[4] 业务内容与技术演进 - 数据标注业务服务于汽车自动驾驶的路况识别、AI动画视频生成等,是让人工智能更加智能的基础[1] - 标注工作已从简单劳动转向需要专业知识的创造性工作,AI技术的迭代倒逼从业者持续学习[5] - 具体标注内容包括对真实道路图片里的车辆、路沿、红绿灯进行框线标注,并填写“无遮挡”“路沿高15厘米”等属性信息[1] 政策激励与人才支撑 - 2025年,贵州出台政策对数据标注企业给予奖励:企业当年数据标注从业人员首次达300人或营收达到3000万元,即可获得100万元奖励,根据企业规模,最高奖励达1000万元[3] - 政策红利持续释放推动企业成长[3] - 地方大数据发展管理局与全市多所开设大数据专业的院校建立紧密联系,向企业进行人才输送,为专业人才提供实践机会和职业发展平台[3]
大山深处,数据标注员越来越多
人民日报· 2025-12-18 06:11
行业背景与市场需求 - 生成式人工智能和数据要素市场化进程加快,催生了市场对高质量数据集的旺盛需求 [1] - 数据标注作为人工智能产业链的基础环节,其重要性日益凸显,正成为新兴职业 [1] 地区产业发展与政策支持 - 贵州省贵阳市白云区已建成多个企业特色园区和超过8万平方米的白云数据空间产业化基地 [1] - 贵州省于2025年出台针对数据标注企业的鼓励政策,根据企业规模提供阶梯式现金奖励 [1] - 政策规定,企业当年数据标注从业人员首次达到300人或营收达到3000万元,即可获得100万元奖励,最高奖励可达1000万元 [1] - 白云区规划了数个数据标注基地,预计将带动超过5000人就业 [1] 业务运营与人才发展 - 数据标注业务涵盖对真实道路图片中的车辆、路沿、红绿灯进行框线标注并填写属性信息,以及对动漫画面进行逐帧解释说明 [1] - 地区政府与当地开设大数据专业的院校建立紧密联系,为行业输送人才 [1] - 企业为数据产业相关专业人才提供实践机会和职业发展平台,形成产学研联动 [1]
四中全会精神在基层|大山深处,数据标注员越来越多
新华社· 2025-12-17 20:33
行业概览与政策驱动 - 生成式人工智能和数据要素市场化加快推进,催生了对高质量数据集的旺盛需求[3] - 在此背景下,贵州正大力培育数据标注全产业链[3] - “十四五”期间,贵州数字产业规模年均增速达16.2%,预计到今年底将达到2800亿元左右[5] - 其中,软件和信息技术服务业收入规模突破千亿元大关[5] - 全面实施“人工智能+”行动被提出,旨在以人工智能引领科研范式变革,赋能千行百业[5] 产业发展现状与规模 - 贵州当地数据标注产业已初具规模,前期集聚了67家数据标注企业[5] - 数据标注产业从业人员总人数超过9100人[5] - 以南国大数据(贵州)有限公司为例,其员工规模已超700人,未来有望带动超2000人就业[3] - 白云区以贵州省首个数据开发利用加工基地为核心,已建成多个企业特色园区和超8万平方米的产业化基地[3] - 全区规划数个标注基地,预计将带动超5000人就业[3] 具体业务与应用场景 - 数据标注业务包括对空间、逻辑和意图进行说明,服务于汽车自动驾驶的路况识别、AI动画视频生成等[1] - 具体工作涉及在真实道路图片里对车辆、路沿、红绿灯进行框线标注,并填写如“路沿高15厘米”等属性信息[1] - 标注工作是让人工智能更加“智能”的基础[1] - 行业技术迭代推动标注工作从简单劳动转向需要专业知识的创造性工作[5] 政府激励政策 - 2025年,贵州出台政策对数据标注企业给予奖励[3] - 企业当年数据标注从业人员首次达300人或营收达到3000万元,即可获得100万元奖励[3] - 根据企业规模,奖励分为多档,最高奖励达1000万元[3] - 政策红利持续释放,推动了企业成长[3] 人才培养与产教融合 - 产业发展的人才支撑是关键[4] - 地方政府已与多所开设大数据专业的院校建立紧密联系,向企业进行人才输送[4] - 产教融合模式让学生在校期间接触实际项目,兼具理论和实操技能的毕业生经考核可直接上岗[4] - 南国大数据今年超过400名来自合作院校的学生完成实习,其中约20%的人通过考核留任[4] - 为适应行业变化,企业正与学校建立科研团队,研发自己的标注平台和预标注平台[5] 公司案例:南国大数据 - 南国大数据(贵州)有限公司已在多个市州拥有分公司[3] - 公司员工规模超700人,并计划继续扩大规模[3] - 公司运营南国数据标注孵化基地,基地内标注员正在进行数据标注工作[1][3]
“十四五”期间贵州数字产业规模年均增速16.2%
新华网· 2025-12-17 16:54
数字经济发展成就 - “十四五”期间,贵州数字产业规模年均增速达16.2%,预计到2024年底将达到2800亿元左右 [1] - 行业“质”的提升显著,已形成一批具有核心竞争力的特色产业和企业,年经营收入超亿元的企业有54家,上市企业达14家 [1] - 云服务、数据标注、算力运营服务等产业聚势而起,具有贵州特色的数字产业集群正在加速构建 [1] 实数融合与数字化转型 - 实施“万企融合”大赋能行动,发布实施实数融合评估地方标准,每年面向全省近2万家企业开展评估 [1] - 累计为企业提供超过10万份评估诊断报告,并“一企一策”引导企业开展数字化转型 [1] - 推动工业、能源、农业等领域链主企业建设产业赋能平台,通过链式转型带动超过3万家企业“上云用云” [1] 数字基础设施与数据价值 - 数字产业发展的“底座”不断夯实,在建和投运的重点数据中心增长到50个 [2] - 贵安数据中心集群已成为全国智算能力最强、智算资源最多的地区之一 [2] - 数据共享开放水平连续多年位居全国第一梯队,持续推动数据“供得出”以激活数据价值潜能 [2] 产业带动就业效应 - 数字产业的蓬勃发展创造了更多就业机会,数据标注产业在全省多点开花,仅2024年以来就新增就业超万人 [2] - 目前全省数字产业从业人员已超过16.3万人,大数据人才总量达到47.5万人左右 [2] - 数字产业已成为促增长、稳就业的重要引擎 [2]
贵州预计2025年底数字产业规模将突破2800亿元
中国新闻网· 2025-12-17 14:32
数字产业规模与增长 - 贵州省预计到2025年底数字产业规模将突破2800亿元人民币 [1] - “十四五”期间,贵州数字产业规模年均增速达16.2% [1] - 预计到2025年底,软件和信息技术服务业收入规模将突破千亿元大关 [1] 产业发展与企业培育 - 作为中国首个国家级大数据综合试验区,贵州培育了一批具有核心竞争力的特色产业和企业 [1] - 年经营收入超过亿元的企业有54家,14家企业已上市 [1] - 云服务、数据标注、算力运营服务等产业聚势而起 [1] 就业与人才发展 - 数字产业的蓬勃发展创造了更多就业机会,2025年以来数据标注产业新增就业超万人 [1] - 目前贵州数字产业从业人员已超过16.3万人 [1] - 大数据领域人才总量约为47.5万人 [1] 人工智能与大模型应用 - 贵州抢抓人工智能发展机遇,2024年以来聚焦24个重点行业领域打造形成110余个大模型典型应用场景 [1] - “黄小西”AI智能体等17个行业大模型已上线运行 [1] 算力基础设施发展 - 贵州加快打造面向全国的算力保障基地,在建和投运的重点数据中心从2020年的7个增长到50个 [2] - 算力总规模预计到2025年底将达到150 EFLOPS(每秒百亿亿次浮点运算) [2] - 智算占比已超过97%,贵安数据中心集群已成为中国智算能力最强、智算资源最多的地区之一 [2] 数据资源开发与共享 - 贵州加快激活数据价值潜能,持续推动数据“供得出”,累计汇聚数据资源5.8万个 [2] - 实现数据共享交换超110亿次,开放数据集约2.4万个 [2] - 数据共享开放水平连续多年位居中国第一梯队 [2]
关键词读懂“十五五”|乘“数”而上:数实融合催生新质生产力
央广网· 2025-12-17 11:59
国家政策与省级战略 - 国家“十五五”规划建议提出深入推进数字中国建设,促进实体经济和数字经济深度融合,实施工业互联网创新发展工程 [1] - 江苏省数字经济规模超5万亿元,数字经济核心产业增加值达1.45万亿元,占地区生产总值比重达11.4% [6] - 江苏省计划到2027年数字经济核心产业增加值达1.8万亿元,并建立基本的数据要素市场体系 [6] - 江苏省两化融合发展水平连续十年位居全国第一,正积极打造“数实融合第一省” [1] 宿迁市数字经济发展概况 - 宿迁市从传统农业城市转型为“电商名城”,电商相关从业人数达60万人 [2] - 宿迁市已集聚超3万家电商企业,13.2万家活跃网店 [2] - 2024年宿迁市完成电子商务交易额2800亿元,网络零售额852亿元 [2] - 宿迁市平均每秒有35件快递发往世界各地 [2] - 宿迁市拥有1个国家级、7个省级电商(跨境电商)示范基地(园区)及5个省级县域电商产业集聚区 [2] 宿迁市产业转型与升级 - 宿迁市数字经济与实体经济深度融合,5大跨境电商产业带托举起产值突破340亿元的“大数据+”产业集群 [4] - 宿迁市正从“电商名城”向“长三角数智新城”跃迁,聚焦人工智能、数据采集标注、数字金融等重点方向 [4] - 以直播电商为代表的数字经济正加速与宿迁实体经济融合 [4] - 宿迁市在全国设区市中率先出台电商领域地方性法规《宿迁市电子商务产业发展条例》 [4] 数据标注产业发展 - 宿迁市已集聚15家数据标注企业,从业人员超3000人,累计标注数据量达670TB [4] - 宿迁市数据标注产业预计2025年实现营收12亿元 [4] - 宿迁市有4家单位入选国家数标委成员单位,深度参与行业标准制定 [4] - 宿迁已成为华东地区规模最大、技术水平最高的数据标注产业高地之一 [4] 企业数字化转型案例 - 爱猫爱狗宠物用品有限公司通过数字化运营中心(直播间嵌入生产线)等创新举措,近三年复合增长率超过30% [2] - 该公司智能云仓日均处理订单峰值达8万单,实现了从传统制造企业向数字化品牌企业的转型 [2] - 京东自2009年将全国客服中心投运于宿迁,持续投入与核心业务布局,催化了该城市的数字经济转型 [2] 专家观点与发展建议 - 专家建议宿迁市进一步挖掘本土特色产业优势,厚植“电商+产业带”的基础优势,其电商经济具有“扎根性强”与“枢纽性强”双重特征 [3] - 专家建议宿迁市加强对本土电商创业者的观念技能培训,并着力构建低门槛、轻量普惠的AI应用场景 [4] - 专家认为江苏省应强化制造业数字化转型核心优势,引导中小企业“上云用数赋智”,重点推广工业互联网平台在优势产业集群的应用 [6] - 专家建议江苏省打通产学研用创新链条,攻关工业软件、人工智能芯片等关键核心技术,并优化区域协同与要素保障 [6] 发展模式与意义 - 宿迁市的起点更具普遍性,为众多谋求数字化转型的三四线城市提供了参考 [5] - 数字经济的生命力体现在高水平区域的引领,更在于其普惠性与下沉市场的活力 [1]