Workflow
数据采集和标注服务
icon
搜索文档
发展数据标注技术,把数据“原油”炼成“汽油”
人民日报· 2025-10-15 14:46
行业政策与规划 - 国务院提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委等部门提出到2027年数据标注产业年均复合增长率超过20%[2] - 国家数据局已指导7个城市建设数据标注基地,截至今年上半年带动相关产值超过83亿元[2] 产业定义与重要性 - 数据标注是通过给文本、语音、图片、视频等数据打标签,将人类知识转化为计算机语言的关键工艺[1] - 数据标注是人工智能高质量数据集建设的关键环节,能有效提升垂类大模型的专业领域性能[1] - 高质量数据可加速人工智能赋能千行百业,如在分子药物研发和工业质检场景中标记关键信息[2] 市场需求与增长 - 在人工智能大模型和政策驱动下,数据标注需求爆发式增长[2] - 有企业过去一年承接了2000多项数据标注项目需求,预计今年业务量将增长超过30%[2] - 数据标注产业已初步形成覆盖上游数据提供方、中游平台公司、下游服务商的产业链闭环[3] 技术与发展趋势 - 智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注提高效率和准确性[3] - 数据标注产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3] 当前阶段与未来方向 - 数据标注产业还处于初期阶段,需要各方群策群力共同培育产业生态[4] - 各地需加强政策落实和引导,搭建常态化供需对接服务平台[4] - 应用企业需以实际需求驱动数据标注能力体系建设,与标注企业共同开展工具研发和流程优化[4]
发展数据标注技术,把数据“原油”炼成“汽油”(新视点)
人民日报· 2025-10-15 06:12
行业政策与规划 - 国务院于2024年8月印发《关于深入实施"人工智能+"行动的意见》,明确提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委、国家数据局等部门于2024年12月印发《关于促进数据标注产业高质量发展的实施意见》,提出到2027年产业规模大幅跃升,年均复合增长率超过20%[2] - 国家数据局已指导安徽合肥、四川成都等7个城市建设数据标注基地,截至2025年上半年,基地建设数据集524个,服务大模型163个,带动相关产值超过83亿元[2] 行业定义与重要性 - 数据标注是对文本、语音、图片、视频等数据打标签,通过特征提取、分类、注释、标签化等操作,将人类知识转化为计算机可识别语言[1] - 数据标注被誉为将数据"原油"炼成"汽油"的关键工艺,可为数据注入新价值,是人工智能高质量数据集建设的关键环节[1] - 经过标注的高质量数据能有效提升垂类大模型的专业领域性能,加速人工智能赋能千行百业[1] 市场需求与增长 - 在人工智能大模型和相关政策驱动下,数据标注需求呈现爆发式增长[2] - 标贝科技在过去一年承接了2000多项数据标注项目需求,预计2025年业务量将增长超过30%[2] - 数据标注应用场景广泛,包括分子和药物智能研发中对原子、电荷等关键信息标记,以及工业质检中对产品缺陷尺寸、位置、类型等信息标记[2] 产业链与产业生态 - 数据标注产业链覆盖上游数据提供方、中游平台公司、下游服务商,中国已初步形成产业链闭环[3] - 产业集聚带动作用日益凸显,各地加速培育数据标注产业[3] - 产业处于初期阶段,需要加强政策落实和引导,搭建常态化供需对接服务平台,推动行业标准规范建设[4] 技术与发展趋势 - 技术迭代趋势明显,智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注数据,标注员承担关键决策角色以纠正模型错误[3] - 要求提升趋势显著,高质量数据集评判标准更复杂,产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 对象拓展趋势持续,被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3]