Data Annotation
搜索文档
西安数据标注产业如何跑出“加速度”
西安日报· 2025-05-20 10:32
政策支持与行业概况 - 2025年西安市政府工作报告将培育数字产业经营主体列为核心工作要求 明确提出大力发展RISC-V开源芯片 数据标注 人工智能大模型等数字产业 [1] - 2023年我国数据标注市场规模达60 8亿元 同比增长19 69% 其中计算机视觉和智能语音标注占比超85% [2] - 西安具备发展数据标注的先天优势 包括高校密集的科教资源 持续开放的政务数据 以及承接东部产业转移的区位条件 [2] 西安数据标注产业现状 - 中软国际科技服务有限公司 陕西淘丁实业集团有限公司 西安金慧科技有限公司等大中型企业已在西安形成规模化服务能力 全市相关企业总量已超20家 [2] - 淘丁集团研发的"淘丁精标云"数据标注平台已形成覆盖图片 语音 文本 视频的全模态数据采集标注能力 为行业提供定制化数据解决方案 [4] - 淘丁集团与百度 字节跳动 小红书等头部平台建立深度合作 日常处理项目量级超百万 部分数据达千万级 [4] 行业转型与升级 - 数据标注行业正从劳动密集型向知识密集型服务转变 聚焦自动驾驶 智慧医疗等前沿领域 [4] - 西安市将数据标注纳入产业强市重点工程战略部署 为行业转型提供政策机遇 [4] 专家建议与发展路径 - 建议在长安大学城规划标注产业园区 依托高校资源打造产学研用闭环 形成人才优势 [5] - 构建"标准制定+场景应用+人才培养"三位一体的产业生态体系 将西安在科教资源 算力基础 应用场景等方面的优势转化为核心竞争力 [5] - 可考虑建立数据标注质量认证中心 打造涵盖自动驾驶 智能制造 智慧医疗等领域的西安特色高质量数据集 [5]
Innodata Inc:大模型时代“卖铲人”,数据标注乘势而起-20250501
浦银国际证券· 2025-05-01 09:23
报告公司投资评级 - 首次覆盖 Innodata(INOD.US),给予“买入”评级,目标价为 55 美元,潜在升幅 44% [1] 报告的核心观点 - 看好数据标注行业持续受益于大模型推动,市场空间广阔,公司作为稀缺上市标的,市场份额有望持续提升 [9] - 公司深耕数据标注,为大模型提供“燃料”,受益于行业增长、科技巨头资本开支扩张,业绩增长强劲 [13] - 虽市场对公司业绩增长预期存在分歧,但高质量数据需求强劲,人工标注短期不可完全替代,看好公司前景 [9] 各部分总结 投资逻辑 - 随着大模型数据需求提升,公司专注数据清洗、标注,有望受益于数据标注和服务市场高速增长,2023 年全球市场规模达 140.7 亿美元,2024 - 2030 年复合年增长率预计为 20.3% [13] - 公司客户聚焦美国大型科技企业,覆盖“美股七巨头”中的五家,科技巨头围绕 AI 基建的资本支出扩张或带来增量,2024 年收入增长 96%,预计 2025 年收入增长 40%+ [1][13] - 市场对公司业绩增长预期存在分歧,但高质量结构化数据是大模型迭代关键,垂类数据带来增量需求,公司拓展金融、医疗等领域有望打开市场空间;自动化标注是趋势,但人工标注短期不可完全替代,公司在专业领域有布局和行业壁垒,看好业绩前景 [9][14] 深耕数据标注,为大模型提供“燃料” - 公司定位于 AI 数据工程领域,提供 AI 训练数据解决方案,业务包括 DDS、Synodex 以及 Agility 三大板块,分别聚焦数据工程、医疗数据处理和公关媒体监测领域 [16] - DDS 是收入支柱,贡献约 87%收入(4Q24),专注提供高质量数据采集和标注服务;Synodex 收入占比约 3%(4Q24),服务医疗信息领域;Agility 收入占比约 10%(4Q24),为营销传播和公关人员提供服务 [18] - AI 大模型推动数据需求爆发,公司专注收集、清洗和组织原始数据,处于行业重要环节,2024 年收入同比增长 96%,预计 2025 年收入增长 40%+,增速高于行业,市场份额将持续提升 [19] 行业趋势:高质量数据需求日益增长 DeepSeek 大模型如何影响数据标注需求 - DeepSeek 一定程度降低通用数据量需求,通过强化学习筛选高价值推理数据、数据蒸馏技术提炼关键信息,提升推理效率和效果 [28] - 应用层公司私有化部署大模型会带来额外数据标注需求,垂类数据是未来 AI 模型差异化关键,公司拓展金融、医疗等垂直领域有望打开市场空间 [28] - DeepSeek 对数据质量要求更高,高质量精标数据需求强劲,公司在医疗、金融等专业领域有布局,存在行业壁垒,专业化、场景化将成行业趋势 [29] 人工标注是否会被 Scale AI 自动化标注取代 - Scale AI 是数据标注行业标杆,通过 AI 算法辅助标注,自动化标注工具效率可提升 10 倍,发展迅速,业绩和估值高速增长 [30] - 自动化数据标注是行业趋势,Innodata 自动化标注能力与 Scale AI 有差距,主要依赖传统人力外包,但市场需求强劲,两者在不同垂直领域存在错位竞争,看好 Innodata 业绩前景 [31] - 人工标注有不可替代特点,在复杂场景和需要专业知识判断的任务中更准确合理,未来格局或形成自动化标注和人工标注共存互补模式 [33] 财务预测 |指标|2023|2024|2025E|2026E|2027E| |----|----|----|----|----|----| |营业收入(百万美元)|87|170|240|281|307| |经营利润(百万美元)|0|24|33|46|58| |调整后净利润(百万美元)|3|33|29|40|49| |营业收入增速|9.8%|96.4%|41.0%|16.8%|9.4%| |毛利润增速|13.9%|114.3%|43.3%|19.7%|12.1%| |经营利润增速|NM|7552.8%|35.9%|40.3%|25.7%| |净利润增速|-92.6%|NM|-13.1%|40.1%|25.6%| |调整后净利润增速|NM|947.1%|-10.3%|35.5%|23.5%|[2][11] 估值分析与预测 - 首予“买入”评级,目标价 55 美元,对应 2025E/2026E 25x/19x P/E,参照 Scale AI 估值,Innodata 目标价对应 2025 年市销率约 6.9x,折价近 50%,属合理范围 [47] SPDBI 乐观与悲观情景假设 |情景|概率|目标价|情况说明| |----|----|----|----| |乐观情景|20%|70 美元|客户订单持续提升,2025 年收入同比增长高于 60%;公司成本优化显著,毛利率提升至 45% [56] |悲观情景|20%|30 美元|客户订单低迷,2025 年收入同比增长低于 20%;公司成本管控不力,毛利率下滑至 35% [56] 财务报表 利润表 |指标|2023|2024|2025E|2026E|2027E| |----|----|----|----|----|----| |收入(百万美元)|87|170|240|281|307| |收入成本(百万美元)|(55)|(103)|(144)|(166)|(178)| |毛利(百万美元)|31|67|96|115|129| |销售费用(百万美元)|(31)|(43)|(63)|(69)|(71)| |经营盈利(百万美元)|0|24|33|46|58| |除税前盈利(百万美元)|0|24|33|47|58| |年度盈利(百万美元)|(1)|29|25|35|44| |调整后净利润(百万美元)|3|33|29|40|49|[11][58] 现金流量表 |指标|2023|2024|2025E|2026E|2027E| |----|----|----|----|----|----| |净利润(百万美元)|(1)|29|25|35|44| |经营活动现金流(百万美元)|6|35|21|36|47| |投资活动现金流(百万美元)|(5)|(8)|(7)|(7)|(7)| |融资活动现金流(百万美元)|3|6|7|8|9| |现金及现金等价物增加净额(百万美元)|4|33|22|37|48| |期末的现金及现金等价物(百万美元)|14|47|69|105|154|[11][60] 资产负债表 |指标|2023|2024|2025E|2026E|2027E| |----|----|----|----|----|----| |固定资产(百万美元)|2|4|4|4|5| |无形资产(百万美元)|16|15|16|16|17| |非流动资产合计(百万美元)|27|32|33|34|34| |流动资产合计(百万美元)|32|81|114|158|210| |资产总额(百万美元)|59|113|147|191|245| |权益总额(百万美元)|25|63|96|139|191| |负债总额(百万美元)|34|50|52|53|53| |权益及负债总额(百万美元)|59|113|147|191|245|[11][59]
市数据局深入调研长沙综合标注基地,助力国家数据标注基地建设再提速
长沙晚报· 2025-04-12 01:16
文章核心观点 长沙市数据局调研中兴通讯长沙基地和长沙综合数据标注基地,肯定发展成果并对各方提出发展要求,推动长沙数字经济发展 [1][4][5] 调研情况 - 调研组参观中兴通讯长沙基地展厅并听取产品及生产线情况介绍,对其发展成果高度评价,勉励发挥龙头优势带动产业协同发展 [4] - 调研组参观长沙综合数据标注基地新入驻数据企业,召开座谈会了解前期情况、发展规划及企业诉求 [4] 长沙数据标注基地建设情况 - 2024年5月长沙入选承担国家数据标注基地建设任务的7大城市之一,构建“1个综合标注基地 + N个行业标注基地”产业布局,综合标注基地授予长沙信息产业园 [4] - 长沙信息产业园以世界计算・长沙智谷为核心区,提供近5万方办公场地,汇聚多家标注企业,标注数据规模达9700TB,建设14个行业高质量数据集,引入高层次人才1800人,数据标注产值达1亿元 [5] 发展要求 - 长沙将建优市智能标注服务平台,会同相关单位提供全链条服务,为数据标注产业提供平台支撑 [5] - 长沙信息产业园要发挥自身优势,加大宣传推广和招商引资力度,培育多样化应用场景,为企业创造发展机遇 [5] - 市数据标注协会要发挥“连接器”作用,整合资源,搭建交流合作桥梁,营造良好产业发展生态 [5]