Workflow
高质量数据集
icon
搜索文档
海天瑞声20250625
2025-06-26 22:09
纪要涉及的公司和行业 - 公司:海天瑞声、Scale AI、中国移动 - 行业:数据标注产业 纪要提到的核心观点和论据 海天瑞声 - **业务模式**:分为定制服务、标准化产品和与训练数据相关的应用服务三类[3] - **业绩波动因素**:2022 年业绩快速增长得益于下游车厂对自动驾驶视觉数据需求增长;2023 年收入下滑受数据出境法规阶段性影响[4] - **2023 年业绩表现**:整体业绩同比回暖,归母净利润扭亏为盈,毛利率因企业多模态数据投入和独特数据集采购需求提升[6] - **海外市场拓展**:2023 年拓展部分智能终端领域头部海外客户;2024 年境外收入预计同比增长近 90%,超 1 亿元;新加坡控股公司实现订单和产能覆盖[5][14][15] - **政企合作进展**:与中国移动联合发布解决方案,共同拓展政府客户;参与东盟语料库建设及可信数据空间构建;与多地成立合资公司拓展下游应用开发[5][16] - **AI 应用落地**:积累大量标准化产品,拓展相关业务;与中国移动联合发布解决方案,预计项目体量显著增长[17] - **营收增长预期**:预计今年整体营收增长超 40%,达约 3 亿多元;智能语音、自然语言处理和计算机视觉业务预计高速增长,后两者增速超 50%[18] 数据标注产业 - **政策支持与市场增长**:预计到 2027 年复合增长率超 20%;七个试点城市发展相关企业,带动产值超 83 亿元;政策持续关注[2][7] - **数据需求增长与规划**:大模型驱动数据需求从通用知识向专业知识延伸;国家数据局规划建设三类高质量数据集[2][7] - **市场规模与竞争格局**:2025 年市场规模有望突破 100 亿元,增速超 30%;2023 年需求方自建团队占 60%,品牌数据服务商占 35%,市场集中度提升[2][8] - **第三方品牌服务商需求**:大模型对垂直、专业、深度数据挖掘需求增加,第三方品牌服务商需求增长,头部份额将提升[9] Scale AI - **业务模式**:为 AI 和机器学习提供数据标注和管理服务,涵盖数据标注、管理、评估、自动化平台及数据生成服务[10] - **客户群体与营收**:客户包括自动驾驶、金融、政府等;与头部 AI 公司合作;2023 年营收近 9 亿美元,预计 2024 年超 20 亿美元[11] - **融资情况**:2024 年 6 月获 Meta 投资,投后估值约 290 亿美元,Meta 以 14.3 亿美元获 49%股权[10] - **与国防部合作**:2020 年获 9100 万美元订单,2022 年获 2.49 亿美元新合同,业务拓展至数据处理和应用开发,2023 年提供算法优化和模型部署服务[12] - **标注方式平衡**:海外设外包人工标注团队,提升自动化标注水平,大模型后期微调及专业领域仍需人工标注[13] 其他重要但是可能被忽略的内容 - 海天瑞声定制服务知识产权不归公司所有,不能重复销售;标准化产品可重复销售[3] - 海天瑞声作为中国移动参股方,参与国家数据局主持的数据标注领域民营经济座谈会[16]
南财数据周报(51期):10个国家数据要素综合试验区启动建设;高质量数据集技术文件将加快研制
21世纪经济报道· 2025-06-06 18:27
南方财经记者徐小琼 卓皙雯 广州报道 6月3日,国务院正式公布《政务数据共享条例》(以下简称《条例》),对政务数据的目录管理、共享 使用、平台支撑等工作进行部署,推进政务数据安全高效共享利用,进一步提升政府数字化治理能力和 政务服务效能。《条例》作为第一部促进政务数据共享流通的行政法规,标志着我国政务数据管理迈入 法治化新阶段。国家数据局数据资源司相关负责人表示,将积极配合推进条例落地落实,加快公共数据 资源开发利用,更好赋能经济社会高质量发展。 南财数据点评:各政府部门之间的政务数据共享活动一定程度上存在机制不完善、供需对接不充分、责 任边界不清、多头治理等问题,阻碍了政务数据价值的高效利用。而《条例》直面数字政府建设中存在 的"数据孤岛"难题,首次从国家层面以行政法规形式明确了政务数据共享的体制、路径、规则、保障措 施、法律责任等,为政务数据的高效流通提供法治保障。 这不仅是对传统治理模式的系统性革新,更是面向数字文明时代政府治理现代化的主动布局,对提升政 府数字化治理能力和政务服务效能、全面建设数字政府意义深远。 了解详情请点击阅读:《国家首部行政法规推动政务数据共享,治理数据多头收集、回流难》 2.我 ...
中央企业高质量数据集建设和标准化研讨会将召开
快讯· 2025-05-26 19:52
中央企业高质量数据集建设和标准化研讨会 - 国家数据局将组织召开中央企业高质量数据集建设和标准化研讨会,时间为2025年5月29日上午 [1] - 研讨会旨在发挥标准在中央企业高质量数据集建设中的规范和引领作用,助力"人工智能+"专项行动持续深化 [1] - 会议将围绕高质量数据集建设路径、格式要求、分类模式、质量评测、案例示范等方面展开技术交流和实践分享 [1] - 研讨会邀请相关专家代表参与,推动高质量数据集标准助力中央企业人工智能应用场景落地 [1]
建设高质量数据集,让人工智能更聪明(新视点)
人民日报· 2025-05-21 05:51
高质量数据集的定义与重要性 - 高质量数据集是高价值、高密度、标准化的数据,类似于石油经过炼化后成为汽油的过程,原始数据需经过处理才能提升大模型的学习能力和场景适应能力[1] - 数据集的质效提升是人工智能赋能实体经济的"催化剂",高质量数据集影响人工智能的"智商"[1][3] - 深度求索系列模型训练大量使用高质量推理数据集,凸显其重要性[1] 政策与行业行动 - 国家数据局等17部门联合印发《"数据要素×"三年行动计划(2024—2026年)》,提出推动行业共性数据资源库建设,打造高质量人工智能大模型训练数据集[1] - 国务院国资委发布首批10余个行业、30项央企人工智能行业高质量数据集,涵盖电网调度、核电设备健康诊断、金融大模型等领域[1] - 《高质量数据集建设指南(征求意见稿)》发布,提出分三类建设高质量数据集:通识数据集、行业通识数据集、行业专识数据集[3] 行业现状与挑战 - 基础模型开源态势下,数据要素价值凸显,成为人工智能竞争的核心领域[2] - 行业大模型对数据需求多样,不同行业部门对模型场景数据的需求各不相同,增加数据处理和管理的复杂度[2] - 构建和采买数据缺乏统一衡量标准,数据完整性和准确性参差不齐,影响大模型训练效果和预测准确性[2] 未来发展方向 - 国家数据局将构建部际联通、央地协同的工作机制,推动高质量数据集标准体系研究[3] - 促进数据、技术、场景对接,构建多元协同的数据标注产业生态,夯实人工智能发展数据根基[3]
激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元
央视新闻· 2025-05-18 09:17
17日,记者从2025数据安全发展大会上获悉,我国将培育壮大一批数据要素产业链上下游企业,预计到2030年,我国数据产业规模将达到7.5万亿元。 公共数据开放共享 激活海量"沉睡数据" 作为全球首个将数据纳入生产要素的国家,我国已初步构建起门类齐全的数据产业链。数据显示,2024年我国年度数据生产总量达41.06泽字节,同比增长 25%。 截至目前,我国数据领域相关企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年我国数据产业规模将达7.5万亿元。 国家数据局局长 刘烈宏:当前我们正谋划构建横向联通、纵向贯通、协调有力的数据基础设施体系,到2029年要基本建成国家数据基础设施主体结构。 在数据要素与产业融合方面,国家正加快打通公共数据共享开放壁垒,推动公共数据与企业数据深度融合,激活海量"沉睡数据"。 构建高质量数据集 加速人工智能发展 眼下,数据已超越传统生产要素,成为驱动人工智能技术突破与产业变革的核心动力。高质量数据集不仅是人工智能模型性能跃升的基石,更重塑了从技术 研发到商业落地的全产业链条。那高质量数据集是如何构建的? 在浙江温州,作为全国数据要素市场化改革的"试验田 ...
计算机点评报告:数据价值转化加速,高质量数据集赋能AI
中邮证券· 2025-05-07 14:23
行业投资评级 - 强于大市(维持) [1] 核心观点 - 数字中国峰会召开,高质量数据集赋能AI,多地市提出建设高质量数据集,特定垂直行业“场景数据集”有望赋能大模型、AI agent发展 [4][5] - 国家数据局发布70个重点建设的公共数据“跑起来”示范场景,旨在打通公共数据供给 - 流通 - 利用链条,形成可复制推广模式和应用 [6] - 全国首单数 据资产证券化项目在深交所获批,开创数据资产在资本市场作为独立基础资产融资先河,打通数据要素与资本市场价值转化通道 [7] - 国家数据发展研究院揭牌,地方层面辽宁数智集团成立、上海成立数据发展管理工作领导小组,组织架构逐步完善,数据要素市场化提速 [8][9] 行业基本情况 - 收盘点位4675.66,52周最高5440.49,52周最低2805.53 [1] 行业相对指数表现 - 2024年5月至2025年5月计算机相对沪深300指数表现:2024年5月 - 24%,2024年7月 - 17%,2024年9月 - 10%,2024年12月 - 3%,2025年2月4%,2025年5月11% [3] 产业链相关个股 - 高质量数据集相关个股:海天瑞声、三维天地、上海钢联、中远海科、信息发展等 [10] - 公共数据运营相关个股:深桑达、云赛智联、国新健康、山大地纬、久远银海、新点软件、普元信息等 [10] 重点公司盈利预测与投资评级 |代码|简称|投资评级|收盘价(元)|总市值(亿元)|EPS(元)(2025E)|EPS(元)(2026E)|PE(倍)(2025E)|PE(倍)(2026E)| | --- | --- | --- | --- | --- | --- | --- | --- | --- | |688787.SH|海天瑞声|未评级|97.78|58.99|-|-|-|-| |301159.SZ|三维天地|买入|28.88|22.34|2.30|-|19.50|-| |300226.SZ|上海钢联|买入|20.76|66.17|1.33|-|18.06|-| |002401.SZ|中远海科|未评级|14.20|52.78|-|-|-|-| |300469.SZ|信息发展|未评级|33.29|82.64|-|-|-|-| |000032.SZ|深桑达|未评级|22.63|257.52|0.39|0.48|58.43|47.04| |600602.SH|云赛智联|买入|23.48|321.13|0.20|0.24|72.47|59.11| |000503.SZ|国新健康|未评级|10.49|102.94|-|-|-|-| |688579.SH|山大地纬|买入|9.55|38.20|0.62|-|22.11|-| |002777.SZ|久远银海|未评级|17.70|72.26|0.35|0.48|51.26|36.94| |688232.SH|新点软件|买入|33.00|108.9|2.41|-|16.03|-| |6881118.SH|普元信息|买入|23.39|21.48|0.85|-|33.35|-| [12]