Workflow
高质量数据集
icon
搜索文档
截至6月底中国日均Token消耗量突破30万亿
中国新闻网· 2025-08-15 14:12
人工智能Token消耗量 - 截至2024年6月底中国日均Token消耗量突破30万亿[1] - 2024年初日均Token消耗量为1000亿 半年内增长300倍[3] 高质量数据集建设 - 截至2024年6月底中国建设高质量数据集超3.5万个 总体量超400PB[4] - 400PB数据量相当于中国国家图书馆数字资源总量的140倍[4] - 多部门联合推动高质量数据供给 出台相关建设文件[4] 数据交易市场 - 截至2024年6月底高质量数据集累计交易额近40亿元人民币[4] - 数据交易机构挂牌高质量数据集总规模达246PB[4] - 北京数交所高质量数据集交易占比从10%跃升至近80%[4] 中文数据应用 - 中国大模型训练中中文数据占比超60% 部分模型达80%[4] - 中文高质量数据开发供给能力持续增强[4] - 人工智能模型训练推动数据交易需求攀升[4]
国家数据局:数据产业已成为数字经济发展新增长点
证券日报· 2025-08-15 00:12
数据产业发展现状 - 数据产业处于快速发展阶段,已成为数字经济发展的新增长点,2024年全国数据企业数量超过40万家,产业规模达5.86万亿元,较"十三五"规划末增长117% [1] - 数据产业主要包括数据采集汇聚、计算存储、流通交易、开发利用、安全治理和数据基础设施建设及服务等业态 [1] - 数据技术正从商业智能(BI)向人工智能(AI)加速演进,产业生态以数据深度挖掘和融合应用、算法算力和数据高度集成为主要特征 [1] 数据产业链创新 - 2024年上市数据企业平均研发投入较"十三五"规划末增长79%,年均增速15.7%,产业链创新活力持续增强 [1] - 数据驱动技术创新催生出"数据即服务""知识即服务""模型即服务"等新模式、新业态 [1] - 数据"采存算管用"全链条焕新迭代,推动应用创新和产业创新深化 [1] 数据流通与基础设施建设 - 国家数据局计划部署一批数据产业集聚区建设试点,优化产业布局,加快形成产业生态和规模优势 [2] - 将聚焦高质量标准构建、大规模设施部署、市场化生态运营,打造便捷高效、自主安全、世界领先的国家级数据基础设施 [2] - 高质量数据集建设是推动"人工智能+"的关键,截至今年6月底已建设高质量数据集超过3.5万个,总体量超过400PB [3] 数据交易市场表现 - 今年上半年主要数据交易机构新上架数据产品3328个,同比增长70%,人工智能领域高质量数据集产品同比增长2.8倍 [2] - 截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达246PB [3] - 人工智能模型训练推动数据交易需求攀升,数据要素市场化配置改革成效显现 [2][3] 未来发展方向 - 国家数据局将通过体系化布局持续推进高质量数据集建设,重点打造具身智能、低空经济、生物制造等领域数据高地 [3] - 推动全社会强化数据要素价值认同,培育"为优质数据买单"的市场共识,加快数据要素价值共创 [3]
国家数据局:截至2025年6月底 我国已建设高质量数据集总体量超过了400PB
新华财经· 2025-08-14 15:34
刘烈宏介绍,截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数 据集总规模达到了246PB。以北京数交所为例,高质量数据集占交易总量的比例从去年的10%跃升到目 前的近80%。上海、天津、安徽等地正在试点"数据语料作价入股"等新模式,引导企业将高质量数据集 折算为股权投入到相关企业。高质量数据集的发展需要数据标注产业的支撑,我们已布局了成都、沈 阳、合肥等7个数据标注基地,助力高质量数据集的建设。 新华财经北京8月14日电(记者孙广见)8月14日,国家发展改革委党组成员、国家数据局局长刘烈宏在 国新办新闻发布会上表示,截至2025年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了 400PB。(1PB可存储约5亿张2MB大小的高清照片,400PB的总量相当于中国国家图书馆数字资源总量 的140倍左右) 刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。我国是第一个把数据 作为生产要素的国家,多措并举促进数据资源的开发利用。我们强调"人工智能+"行动到哪里,高质量 数据集的建设和推广就要到哪里。我们大力推动高质量数据的供给,出台了高质量数据集建设相 ...
上海、天津、安徽等地正在试点“数据语料作价入股”等新模式
南方都市报· 2025-08-14 13:57
高质量数据集建设进展 - 截至6月底国内已建设高质量数据集超过3.5万个,总容量达400PB(相当于中国国家图书馆数字资源总量的140倍)[2] - 人工智能模型训练推动数据交易需求,6月底累计交易额近40亿元,数据交易机构挂牌数据集规模达246PB[2] - 北京数交所高质量数据集交易占比从去年10%跃升至近80%,上海等地试点"数据语料作价入股"新模式[2] 数据标注与中文数据应用 - 国家数据局在成都、沈阳等7地布局数据标注基地支撑数据集建设[3] - 国内多数AI模型训练使用中文数据占比超60%,部分模型达80%[3] 未来发展方向 - 体系化推进高质量数据集建设,重点布局具身智能、低空经济、生物制造领域数据高地[3] - 推动数据要素价值认同,培育"为优质数据买单"的市场共识[3]
独家对话中国联通赵亚晖,AI时代的“数据燃料”是如何炼成的?
凤凰网· 2025-08-04 20:47
中国联通数据产业底座的核心能力 - 公司作为中国通信行业国家队,拥有海量通信数据资源,并在数据治理、安全流通与行业赋能方面形成特色道路 [1] - 软件研究院是公司自主研发主力,承担数字与智能创新中心职能,副院长赵亚晖负责业务、管理及大数据系统建设 [1] AI时代高质量数据集的战略布局 - 公司数据产业底座覆盖算力、算法、数据三大能力融合,重点建设高质量数据集,包括数据基础设施产品、行业特色数据集及场景化应用 [2] - 沉淀700PB企业数据资源,联合行业伙伴构建400TB以上通信领域及行业数据集,形成"三个一"体系框架(方法论+平台工具+数据集) [2] - 建成8个领域专业化数据集(网络运营、客户服务等),支撑27个大模型场景训练,信息通信数据集入选国资委首批央企高质量建设成果 [3] 数据治理与技术创新实践 - 建立数据集分级分类管理框架,实现全生命周期规范化运营,参与国家级标准制定 [3] - 自主研发全流程工具链,集成多模态数据处理算法与自动化标注引擎,获DataOps工具创新奖 [3] - 通过"数据采集-清洗-标注-质检-应用-评估"闭环处理链路,实现智能化端到端数据生产 [3] 行业赋能与场景化应用 - 对内构建上千个智能体覆盖七大领域(办公管理、市场营销等),涉及千余细分场景,超万人参与 [6] - 对外联合伙伴开发上百个行业应用(装备制造、医疗健康等),典型案例使数据报表制作时间从小时级缩短至分钟级 [6] - 通信数据具备实时性、准确性优势,已开放工业、金融等场景服务,强调数据与大模型场景结合是关键差异化点 [6] 数据安全与流通机制 - 内部部署数据分类分级平台、4A金库等工具,实现数据使用全程上链管控 [7] - 对外构建多重技术防护体系,开发安全态势监测等产品,参与国家可信数据空间建设,推动"可用不可见"流通模式 [7] - 开展隐私计算、区块链等技术探索,协同政府与行业完善数据确权、交易等配套机制 [7]
从传统市场到大模型驱动,AI时代的数据交易革命
第一财经· 2025-07-15 20:00
人工智能大模型对数据交易市场的影响 - 人工智能大模型彻底改变了数据交易市场的游戏规则,高质量数据集需求呈现爆发式增长 [1][2] - 2024年人工智能数据占交易所交易量的10%,2025年已接近80%,增长迅猛 [1] - 传统数据交易市场处于初级和分散状态,具有市场集中度低、标准化程度低、交易透明度低的"三低"特征 [1] 高质量数据集的价值变化 - 高质量训练数据从"有用资源"升级为"战略资产",市场需求指数级增长 [2] - 大模型训练需要多模态、专业化的数据资源,数据集价值取决于专业性、多样性和清洁度 [2] - 金融、医疗、法律等专业领域的数据集价格显著上涨 [3] 行业知识底座与数据模态需求 - AI产业向垂直应用下沉,细分行业理解深度决定模型性能 [3] - 自动驾驶等场景需要跨模态关联数据集(如高清图像、激光雷达点云、毫米波雷达信号等),单一模态数据价值降低 [3] - 私域数据生产日益重要,头部企业建立完整数据产线和企业级RAG知识库 [3] 数据交易市场的未来趋势 - 去中心化与中心化混合架构可能成为主流,形成"监管沙盒+市场化平台+去中心化网络"的多元结构 [3] - 多元化定价与激励机制出现,如代币式激励和深圳"语料券"制度,激活数据供给 [4] - 垂直行业共同体(如行业数据联盟)将突破数据壁垒,降低企业数据获取成本 [4] 中国在数据要素市场的优势 - 庞大的市场规模、丰富的应用场景和积极的政策引导构成独特优势 [5] - 中国有望在全球数据要素市场发展中扮演引领角色 [5]
湖北推进可信数据空间发展 到2028年开发至少300个应用场景
长江商报· 2025-06-18 07:43
湖北省推进可信数据空间发展 - 湖北省发布《湖北省推进可信数据空间发展行动方案》,目标是到2028年建成不少于30个成效突出的可信数据空间,开发不少于300个应用场景,上架不少于2000个数据产品 [1] - 方案提出可信数据空间"建、用、管、服"一体化发展,形成"建空间、用数据、活机制、强生态"闭环 [1] - 五类数据空间建设重点方向包括城市可信数据空间、企业可信数据空间、行业可信数据空间、跨境可信数据空间和个人可信数据空间 [5] 武汉市打造数据要素枢纽城市 - 武汉市数字经济规模占地区生产总值比重超过50%,在2024全国数字经济百强市中排名第10,较上年前进1位 [2] - 武汉市在中国数字生态指数2024中排名第6,较上次前进3位,数据要素市场发展居中部城市之首 [2] - 2024年武汉市共有6个项目获批数据领域中央预算内投资补助资金1.095亿元 [2] 武汉市数据标注产业发展 - 武汉市已有数据标注相关重点企业60余家,开发了一批行业高质量数据集和数据标注工具平台 [3] - 《武汉市数据标注产业发展三年行动方案》提出,到2027年相关资产入表、产品登记、数据交易等业务体量超过50亿元,带动人工智能相关产业规模增量超过100亿元 [3] - 目标引进培育数据标注龙头企业2家,产业规模力争进入全国第一方阵 [3] 可信数据空间建设规划 - 国家数据局提出到2028年建成100个以上可信数据空间 [4] - 可信数据空间通过构建"数据共享安全屋"实现数据价值的安全流转,确保数据"可用不可见" [4] - 支持武汉、襄阳、宜昌等市州开展试点,打造涵盖可信管控、资源交互、敏捷计算等能力的底座 [5]
南财数据周报(51期):10个国家数据要素综合试验区启动建设;高质量数据集技术文件将加快研制
21世纪经济报道· 2025-06-06 18:27
政务数据共享法治化 - 我国首部《政务数据共享条例》正式发布 标志着政务数据管理迈入法治化新阶段 该条例对政务数据的目录管理 共享使用 平台支撑等工作进行部署 [1][2] - 《条例》首次以行政法规形式明确政务数据共享的体制 路径 规则 保障措施 法律责任等 解决"数据孤岛"难题 [2] - 国家数据局将配合推进条例落地 加快公共数据资源开发利用 赋能经济社会高质量发展 [2] 数据要素市场化改革 - 我国将在北京 浙江 安徽等10个省市部署建设国家数据要素综合试验区 支持培育经营主体和繁荣数据市场 [1][3] - 湖南省提出通过三年建设 建立制度规范 落地重大工程 发布典型案例 解决痛点问题 打造数据要素示范标杆 [3] - 河南省明确支持郑州建设数据要素综合试验先行区 加快构建数据基础制度体系 [3] 高质量数据集建设 - 中央企业高质量数据集建设和标准化研讨会召开 重点推进建设指南 格式要求 分类指南等标准制定 [1][4] - 国务院国资委已发布首批30项央企人工智能行业高质量数据集优秀建设成果 成立三大行业数据产业共同体 [5] - 全国数标委将以中央企业为重点开展先行先试 完善标准内容并打造示范案例 [4] 地方数字化实践 - 广州印发《数字广州建设2025年工作要点》 提出32项重点工作 包括拓展"数源工程" 完善数据流通治理体系 [1][5] - 广州将支持城市可信数据空间建设 开展国家数据流通利用基础设施试点和国家物流数据开放互联试点 [5] - 文件紧密对接广州"12218"现代化产业体系 以数字化赋能实体经济 [5]
计算机行业:数据价值转化加速,高质量数据集赋能AI
中邮证券· 2025-05-21 16:53
报告行业投资评级 - 强于大市(维持)[1] 报告的核心观点 - 数字中国峰会召开,高质量数据集赋能AI,多地市提出建设高质量数据集并给予补助,医疗、交通等特定垂直行业“场景数据集”有望赋能大模型、AI agent发展[4] - 跑通数据应用模式,赋能产业发展、金融消费等,发布70个公共数据“跑起来”示范场景,全国首单数据资产证券化项目获批[4] - 组织架构逐步完善,数据要素市场化提速,国家数据发展研究院揭牌,各地成立数据管理机构与数据集团[4] 根据相关目录分别进行总结 数字中国峰会召开,高质量数据集赋能AI - 数字中国发展提速,2024年数字中国建设呈现发展基础夯实、赋能效应强化、数字安全和治理体系完善、数字领域国际合作深化等特点,近三年数字中国发展指数保持10%以上增长,数字经济核心产业增加值占GDP比重达10%左右,跨境电商进出口总额达2.63万亿元,增长10.8%,占外贸总额比重提升至6%[13][15] - 指南引领地方实践,高质量数据集赋能AI,2025年4月30日全国数标委发布国内首个国家层面高质量数据集建设指南,人工智能对高质量场景数据集需求突出,特定领域高质量数据注入可推动人工智能精准训练,未来更多专业维度高质量场景数据集将助推人工智能发展,地方出台相关扶持补贴政策,广州上线平台发布数据集,多地给予企业补助,国家数据局推动高质量数据集建设[19][21] - 建设可信数据空间,释放数据价值,2024年国家数据局发布行动计划,提出到2028年建成100个以上可信数据空间,2025年4月18日相关文件公开征集意见规范技术架构[25] 跑通数据应用模式,赋能产业发展、金融消费等 - 公共数据“跑起来”,赋能千行百业,2025年4月28日发布70个公共数据“跑起来”示范场景,打通数据链条,形成可复制模式,我国数据要素市场化配置改革深化,数据资产入表规模将从2024年的487亿元增长至2030年的8278亿元,4月14日全国首单数据资产证券化项目获批,总储架规模达5亿元[27][30] - “数据要素×”典型案例发布,乘数效应显现,2024年5月发布第一批20个“数据要素×”典型案例,涵盖12个行业和领域,覆盖12个省市及部分企业,彰显数据要素推动经济社会发展的乘数效应[32] 组织架构逐步完善,数据要素市场化提速 - 国家数据发展研究院揭牌,2023年国家数据局组建,2024年各地完成机构组建,2025年4月25日国家数据发展研究院揭牌,其将围绕国家战略和数据重点任务开展工作[37] - 省级数据集团陆续组建,市场化发展提速,各地成立数据管理机构与数据集团,我国已组建几十家数据集团公司,近期上海成立数据发展管理工作领导小组推动“数字上海”建设[38] 产业链相关个股 - 高质量数据集相关个股有海天瑞声、三维天地等[5][41] - 可信数据空间相关个股有深桑达、云赛智联等[5][41] - 公共数据运营相关个股有博思软件、中科江南等[5][41]
数据价值转化加速,高质量数据集赋能AI
中邮证券· 2025-05-07 12:55
报告行业投资评级 - 强于大市(维持) [1] 报告的核心观点 - 数字中国峰会召开,高质量数据集赋能AI,多地市提出建设高质量数据集,特定垂直行业“场景数据集”有望赋能大模型、AI agent发展 [4][5] - 跑通数据应用模式,国家数据局发布70个重点建设的公共数据“跑起来”示范场景,旨在打通公共数据供给 - 流通 - 利用链条,形成可复制推广模式和突出应用 [6] - 地方层面积极进行数据要素市场化探索,全国首单数 据资产证券化项目在深交所获批,开创数据资产在资本市场融资先河 [7] - 组织架构逐步完善,国家数据发展研究院揭牌,地方层面辽宁省数智集团成立、上海市成立数据发展管理工作领导小组,数据要素市场化提速 [8][9] 行业基本情况 - 收盘点位4675.66,52周最高5440.49,52周最低2805.53 [1] 行业相对指数表现 - 2024年5月至2025年5月计算机与沪深300相对值变化,计算机从 - 24%到46%,沪深300未明确给出具体变化数据 [3] 近期研究报告相关 - 《MCP开启智能体新时代》于2025.04.27发布 [4] 产业链相关个股 - 高质量数据集相关个股:海天瑞声、三维天地、上海钢联、中远海科、信息发展等 [10] - 公共数据运营相关个股:深桑达、云赛智联、国新健康、山大地纬、久远银海、新点软件、普元信息等 [10] 重点公司盈利预测与投资评级 |代码|简称|投资评级|收盘价(元)|总市值(亿元)|EPS(元)(2025E)|EPS(元)(2026E)|PE(倍)(2025E)|PE(倍)(2026E)| | --- | --- | --- | --- | --- | --- | --- | --- | --- | |688787.SH|海天瑞声|未评级|97.78|58.99|-|-|-|-| |301159.SZ|三维天地|买入|28.88|22.34|2.30|-|19.50|-| |300226.SZ|上海钢联|买入|20.76|66.17|1.33|-|18.06|-| |002401.SZ|中远海科|未评级|14.20|52.78|-|-|-|-| |300469.SZ|信息发展|未评级|33.29|82.64|-|-|-|-| |000032.SZ|深桑达|未评级|22.63|257.52|0.39|0.48|58.43|47.04| |600602.SH|云赛智联|买入|23.48|321.13|0.20|0.24|72.47|59.11| |000503.SZ|国新健康|未评级|10.49|102.94|-|-|-|-| |688579.SH|山大地纬|买入|9.55|38.20|0.62|-|22.11|-| |002777.SZ|久远银海|未评级|17.70|72.26|0.35|0.48|51.26|36.94| |688232.SH|新点软件|买入|33.00|108.9|2.41|-|16.03|-| |6881118.SH|普元信息|买入|23.39|21.48|0.85|-|33.35|-| [12] 公司简介 - 中邮证券2002年9月经中国证券监督管理委员会批准设立,注册资本50.6亿元人民币,是中国邮政集团有限公司绝对控股的证券类金融子公司 [17] - 公司经营范围包括证券经纪、自营、投资咨询等多项业务,还具有多项业务资格 [17] - 公司在多地设有分支机构,全国多家分支机构正在建设中 [17]