数据产业规模与增长 - 我国数据产业规模预计2030年达7.5万亿元 年均增长率超20% [1] - 2024年我国数据生产总量达41.06泽字节 同比增长25% [1] - 当前数据领域相关企业超19万家 数据产业规模超2万亿元 [1] 数据基础设施与政策 - 国家谋划构建横向联通、纵向贯通的数据基础设施体系 2029年基本建成主体结构 [3] - 公共数据开放共享成为数据要素市场化突破口 地市级以上平台数量增长7.5% 开放数据量增长7.1% [5] - 加快打通公共数据共享开放壁垒 推动公共数据与企业数据深度融合 [6] 高质量数据集与人工智能 - 高质量数据集数量同比增长27.4% 支撑人工智能训练和应用 [15] - 数据标注产业产值突破80亿元 进入规模化、规范化发展阶段 [14] - 构建335个高质量数据集 标注总规模达1.7万亿TB 支撑121个国产大模型研发 [17] 数据要素市场化实践 - 温州构建数据安全与合规体系 形成数据交易生态圈 开发469款数据产品 [7][9] - 大模型数据集构建包含采集、清洗、标注、评估等环节 需针对性技术研发 [9] - 非文本数据如图像、视频将成为大模型学习重要来源 [11] 数据标注与清洗技术 - 数据标注通过贴标签教会AI认知世界 未经标注数据如同乱码教材 [11] - 数据清洗剔除重复修正错误 混乱数据直接影响AI训练效果 [11] - 数据覆盖广泛场景并专业标注后 AI模型才能突破实验室精度实现产业落地 [13] 行业发展挑战 - 面临数据存量小产量低、质量良莠不齐、缺乏高价值数据引领、利用效率低等问题 [17] - 需加强数据源头管控 确保来源可靠性和完整性 推动安全评估能力建设 [19]
激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元
央视新闻·2025-05-18 09:17