政策发布与目标 - 江苏省工信厅会同国家工业信息安全发展研究中心发布了《江苏省制造业领域面向人工智能的数据治理工作参考指引(2026年版)》[1] - 该指引旨在指导江苏省制造业企业系统化开展数据治理工作,以用好面向人工智能的数据治理技术和方法[1] 数据治理的重要性与趋势 - 人工智能应用的核心是依托高质量数据完成模型训练、推理与迭代[1] - 数据治理是保障数据质量的核心抓手[1] - 人工智能应用的深化,正推动数据治理工作从“被动合规”向“主动价值驱动”升级[1] 制造业当前数据痛点 - 制造业领域存在数据“孤岛”与“失真”、数据治理与标准化缺失、数据与应用场景脱节等痛点问题[1] - 这些问题严重制约了高质量、场景化数据集的供给[1] 指引的核心内容与结构 - 新版指引结合了31个人工智能典型应用场景[1] - 指引面向不同水平的企业,划分了数据治理入门、基础、进阶三个等级[1] - 该指引为全省大中小企业典型场景的人工智能应用提供可对标、可参考、可部署的数据治理适配方案[1] 数据治理的具体技术环节 - 指引聚焦数据采集、预处理、特征工程、数据标注、数据划分、数据增强等六大核心环节[2] - 指引分门别类地给出了每个环节的治理路径[2] - 制造业企业可结合自身技术基础、资源条件及实际业务痛点,针对性选取适配的环节落地数据治理技术,以最大化挖掘数据价值[2] 各环节面临的典型问题与解决方案 - 在数据采集中,存在数据“采不到”“采不准”“采不全”,以及“格式乱”“分布散”“溯源难”等问题[2] - 在数据预处理过程中,会遇到数据“脏、乱、繁”等问题[2] - 指引在每个环节均列出了数据采集核心技术应用清单和配套工具清单,企业可根据问题对照解决[2]
破解数据“采不准、格式乱”难题
新华日报·2026-02-08 04:13