数据标注
搜索文档
构建与我国对外投资贸易相宜的海外综合服务体系
21世纪经济报道· 2025-10-20 16:45
《方案》明确,探索推动新一代信息技术与城市基础设施建设深度融合,进一步夯实城市治理数字底 座,筑牢城市安全新防线,创新城市(300778)民生服务新模式,培育经济发展新动能,推动城市安全 发展,助力宜居、韧性、智慧城市建设。到2027年年底前,新型城市基础设施建设各项重点任务取得明 显进展,形成一批可复制可推广的经验做法。 近日,住房城乡建设部等九部门联合发布《贯彻落实 <中共中央办公厅 国务院办公厅关于推进新型城市基础设施建设打造韧性城市的意见="国务院办公厅关 于推进新型城市基础设施建设打造韧性城市的意见"> 行动方案(2025-2027年)》(以下简称《方案》),推 进数字化、网络化、智能化新型城市基础设施建设,增强城市风险防控和治理能力。 住建部等九部门推进新型城市基建,商务部等五部门完善海外服务体系,公安部推6项交管"一网通 办"措施,多地优化营商环境,提升政务服务效能。 时政要闻 住建部等九部门:推动新一代信息技术与城市基础设施建设深度融合,夯实城市治理数字底座 《方案》提出,推动实施智能化市政基础设施建设和改造,编制并实施设施建设和改造行动计划、探索 设施信息动态更新机制、推进城市生命线安全工程 ...
发展数据标注技术,把数据“原油”炼成“汽油”
人民日报· 2025-10-15 14:46
行业政策与规划 - 国务院提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委等部门提出到2027年数据标注产业年均复合增长率超过20%[2] - 国家数据局已指导7个城市建设数据标注基地,截至今年上半年带动相关产值超过83亿元[2] 产业定义与重要性 - 数据标注是通过给文本、语音、图片、视频等数据打标签,将人类知识转化为计算机语言的关键工艺[1] - 数据标注是人工智能高质量数据集建设的关键环节,能有效提升垂类大模型的专业领域性能[1] - 高质量数据可加速人工智能赋能千行百业,如在分子药物研发和工业质检场景中标记关键信息[2] 市场需求与增长 - 在人工智能大模型和政策驱动下,数据标注需求爆发式增长[2] - 有企业过去一年承接了2000多项数据标注项目需求,预计今年业务量将增长超过30%[2] - 数据标注产业已初步形成覆盖上游数据提供方、中游平台公司、下游服务商的产业链闭环[3] 技术与发展趋势 - 智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注提高效率和准确性[3] - 数据标注产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3] 当前阶段与未来方向 - 数据标注产业还处于初期阶段,需要各方群策群力共同培育产业生态[4] - 各地需加强政策落实和引导,搭建常态化供需对接服务平台[4] - 应用企业需以实际需求驱动数据标注能力体系建设,与标注企业共同开展工具研发和流程优化[4]
发展数据标注技术,把数据“原油”炼成“汽油”(新视点)
人民日报· 2025-10-15 06:12
行业政策与规划 - 国务院于2024年8月印发《关于深入实施"人工智能+"行动的意见》,明确提出支持发展数据标注、数据合成等技术,培育壮大数据处理和数据服务产业[1] - 国家发展改革委、国家数据局等部门于2024年12月印发《关于促进数据标注产业高质量发展的实施意见》,提出到2027年产业规模大幅跃升,年均复合增长率超过20%[2] - 国家数据局已指导安徽合肥、四川成都等7个城市建设数据标注基地,截至2025年上半年,基地建设数据集524个,服务大模型163个,带动相关产值超过83亿元[2] 行业定义与重要性 - 数据标注是对文本、语音、图片、视频等数据打标签,通过特征提取、分类、注释、标签化等操作,将人类知识转化为计算机可识别语言[1] - 数据标注被誉为将数据"原油"炼成"汽油"的关键工艺,可为数据注入新价值,是人工智能高质量数据集建设的关键环节[1] - 经过标注的高质量数据能有效提升垂类大模型的专业领域性能,加速人工智能赋能千行百业[1] 市场需求与增长 - 在人工智能大模型和相关政策驱动下,数据标注需求呈现爆发式增长[2] - 标贝科技在过去一年承接了2000多项数据标注项目需求,预计2025年业务量将增长超过30%[2] - 数据标注应用场景广泛,包括分子和药物智能研发中对原子、电荷等关键信息标记,以及工业质检中对产品缺陷尺寸、位置、类型等信息标记[2] 产业链与产业生态 - 数据标注产业链覆盖上游数据提供方、中游平台公司、下游服务商,中国已初步形成产业链闭环[3] - 产业集聚带动作用日益凸显,各地加速培育数据标注产业[3] - 产业处于初期阶段,需要加强政策落实和引导,搭建常态化供需对接服务平台,推动行业标准规范建设[4] 技术与发展趋势 - 技术迭代趋势明显,智能化标注技术不断突破,人机协同标注模式日益成熟,通过人工智能预标注数据,标注员承担关键决策角色以纠正模型错误[3] - 要求提升趋势显著,高质量数据集评判标准更复杂,产业从劳动密集型转变为知识密集型,对从业者专业要求越来越高[3] - 对象拓展趋势持续,被标注数据从文本、图像等单模态向多模态转变,领域从通识扩展到医疗、工业制造等专识领域[3]
国家数据局党组书记、局长刘烈宏赴河北保定开展调研
新浪财经· 2025-09-25 20:57
调研活动概况 - 国家数据局局长刘烈宏于9月25日赴河北省保定市进行调研 [1] - 调研内容围绕数据资源开发利用和授权运营、数据标注产业发展、高质量数据集建设等情况 [1] - 调研地点包括保定市城市展示中心、数据要素创新中心、人工智能数据处理和质量测评中心、河北数云堂智能科技有限公司、保定数据湾、市公安局大数据联创中心、长城汽车集团哈弗技术中心 [1] 政策方向与政府角色 - 要全力推进数据要素市场化配置改革 [1] - 需加快推动公共数据授权运营 [1] - 强调发挥政府的引领作用以推动数据应用场景有效落地 [1] 数据标注产业与人工智能发展 - 保定被定位为国家数据标注基地 [1] - 肯定保定在规划布局发展标注产业方面取得良好的阶段性成效 [1] - 下一步将着力推动数据标注产业高质量发展 [1] - 目标是以标注能力提升赋能高质量数据集建设 [1] - 最终目的是促进人工智能在各行业领域的深度应用,助力行业的数字化、网络化、智能化转型 [1]
北京举办残疾人专场招聘会
人民日报· 2025-09-22 06:41
招聘活动概况 - 北京市残联于9月19日主办残疾人专场招聘会 [1] - 京东、小米等60余家用人单位参与并提供百余个岗位 [1] - 活动吸引600多名残疾人参加 156名应聘者与用人单位初步达成招聘意向 [1] 岗位与行业覆盖 - 岗位设置覆盖现代服务和数字产业 包括人力资源、行政管理、市场营销、信息技术、新媒体运营、数据标注等 [1] - 岗位设置同时涵盖加工制造、医疗健康、餐饮服务等行业 [1] 活动特色与服务 - 活动现场设置AI一体机职业指导区、政策咨询区、服务保障区等专区 [1] - 招聘会为不方便到场者设置线上通道 求职者可通过线上报名通道发送简历 [1]
济南|“喂养”人工智能,培育数据标注产业
大众日报· 2025-09-18 08:44
政策支持与产业规划 - 济南市公布《数据标注产业发展行动方案(2025—2026年)》,出台一揽子扶持政策助力产业发展 [5] - 规划建设8个数据标注园区,包括3个综合型园区和5个特色型园区(如历下医疗大健康、市中望岳·智谷园区) [5] - 围绕工业制造、医疗健康等10个领域建设高质量数据集,并针对13条主攻产业链培育本地经营主体 [5] 数据标注的行业价值与技术关键 - 数据标注是人工智能产业的基石,将原始数据转化为大模型可识别的语料,数据质量直接决定大模型性能 [2][3] - 高质量数据标注需专业知识背景,例如医学数据标注要求临床医学专业背景,金融数据标注要求金融专业及券商从业经验 [4] - 数据标注错误会导致大模型出现“幻觉”且难以纠正,专家标注的数据能训练出专家水准的模型 [3][4] 本地企业发展与市场生态 - 山东宣驰信息科技有限公司已孵化7家企业,从业人员300多人,预计至明年年底规模将达1500人 [4] - 企业客户多为阿里、字节跳动、腾讯等互联网大厂,产业呈现抱团发展趋势以承接大单急单 [4] - 济南依托“四区叠加”优势及大模型、软件产业生态,正从医疗、文化、高阶智驾等高端领域切入市场 [6] 应用场景与产业前景 - 数据标注支撑自动泊车、智能驾驶、AI政务员、医学影像识别(如肺癌早筛钙化灶标注)等多种应用 [2][3][4] - 产业未来市场前景广阔,通过释放数据要素价值赋能大数据与人工智能产业高质量发展 [7] - 当前产业存在高水平人才供不应求、技术创新能力待提升等问题,需完善顶层设计 [7]
速递|数据标注战场升温:前麦肯锡高管掌舵Invisible Technologies获1亿美元融资,估值突破20亿美元
Z Potentials· 2025-09-17 11:34
融资与估值 - 人工智能初创公司Invisible Technologies在新一轮融资中筹集1亿美元资金 [1] - 此轮融资由Vanara Capital领投 是Vanara自2022年8月从TPG Inc分拆后首次公开披露的投资项目 [1] - 公司在此次交易中的估值超过20亿美元 [1] 业务定位与竞争优势 - 公司作为Scale AI的竞争对手 专注于数据标注领域 为AI模型的海量信息进行整理归类 [1] - 通过提供更复杂领域的标注服务与竞争对手形成差异化 推出"专家市场"让AI公司筛选具有相关背景的数据标注员(如拥有数学或天体物理学高等学位的人才) [3] - 核心优势在于与客户建立紧密且专业的合作关系 擅长与大型语言模型合作伙伴开展深思熟虑的研究设计协作 [6] - Vanara Capital看重Invisible标注员和注释员网络所具备的专业素养 认为公司在交付高复杂度、高难度工作成果方面表现突出 [3] 财务与运营表现 - 2024年公司销售额达1.34亿美元 较上年翻倍 [5] - 公司目前拥有350名员工 工程团队规模在2024年翻了一番 [4] 客户与产品线 - 客户包括Cohere Inc、微软和亚马逊云服务 [5] - 除数据标注服务外 还提供模型微调工具、模型数据广度测量工具、供应链管理工具以及为联络中心客服人员生成话术脚本的产品 [5] - 设有面向食品饮料、保险、资产管理和医疗保健等行业的企业业务 目前正在开发客户关系管理软件 [5] 行业背景与竞争格局 - 数据标注行业在2024年6月获得主流关注 当时Meta收购了Scale公司49%的股份 使Scale估值超过290亿美元 [3] - 除Scale外 竞争对手包括Surge AI(正洽谈以至少250亿美元估值融资10亿美元)、Turing、Labelbox Inc和Mercor [5] - 行业竞争日益激烈 但企业愈发期望看到AI工具投资带来的实际效益 提升商业盈利的实战能力变得更为关键 [6] 公司发展历程与战略方向 - 公司成立10年 其技术为OpenAI初代ChatGPT的训练提供了支持 [1] - 2025年1月任命麦肯锡AI软件开发部门前负责人马修·菲茨帕特里克担任CEO [4] - 公司坚信未来十年的机遇在于让AI真正落地见效 目前业界对如何部署模型、进行测试验证仍缺乏清晰认知 [6]
多地发力数据标注产业高质量发展
证券日报网· 2025-09-05 20:57
行业政策与战略部署 - 多地政府积极部署数据标注产业发展 山西省 江苏省 天津市 湖北省等发布产业支持措施 如山西省多部门联合推出《关于促进数据标注产业高质量发展的若干措施》[1] - 数据标注是提升人工智能算法和模型核心能力的关键环节 精准标注能提升数据价值密度 本质是抢占AI底层基础设施制高点[1] - 不同地区发展重点包括支持技术创新 鼓励公共服务平台建设 集中培育重点企业 其中数据标注基地建设受到广泛关注[1] 国家级基地建设进展 - 2024年4月全国数据工作会议首次提出探索建设国家级数据标注基地[2] - 国家数据局确定7个城市建设基地 包括山西省大同市 四川省成都市 辽宁省沈阳市 安徽省合肥市 湖南省长沙市 海南省海口市 河北省保定市[2] - 截至上半年7个基地建设数据集达524个 规模超过29PB 服务大模型163个[2] - 在中央和地方共同努力下 数据标注基地将实现量质双升 带动产业布局优化和区域协同增强[2] 产业特征与发展前景 - 数据标注产业呈现高技术含量 高知识密度 高价值应用的"三高"特征 是人工智能发展的基石[2] - 产业未来具有广阔发展前景 将为人工智能产业从技术单点突破向全链条能力建设转变注入新动能[1][2] 当前发展瓶颈 - 智能标注技术供给不足 人工标注效率低 高水平专业人才短缺制约产业高端化发展[3] - 需重点攻关跨模态语义对齐 大模型标注等关键核心技术[3] - 需建立国家标准体系提升数据质量与通用性 培育龙头企业和特色产业基地[3] - 应深化产教融合助力人才培养 拓展自动驾驶 医疗等场景的深度应用[3]
江苏绘就数据“蓝图”
国际金融报· 2025-08-31 00:36
发展目标 - 到2027年底建设不少于1000个完整规范、准确实用的高质量数据集 [1][2] - 产业规模在全国占比预计超过10%且年均复合增长率超过20% [2] - 打造3个数据标注基地并培育10个左右创新引领力强、要素集聚力强、行业影响力强的数据标注重点企业 [2] 产业布局与集群效应 - 形成全国领先、全球有影响力的数据标注产业集群并通过基地和重点企业实现资源优化配置 [2] - 产业集聚可降低企业运营成本并促进企业间交流合作与创新活力 [2] - 企业共享技术设备和标注人才以提高标注效率和质量 [2] 数据集覆盖领域 - 首批高质量数据集涉及交通运输、医疗健康、金融服务、文化旅游、教育教学等17个生活服务场景领域 [3] - 自动驾驶数据集聚焦路端感知、特定场景与任务、4D成像雷达等关键方面 [3] - 网约车数据集覆盖智能调度、出行保障、订单信息、行程录音等关键环节 [4] 典型应用案例 - 遴选100个可复制、可推广的典型应用案例作为产业发展样板间 [6] - 案例证明数据标注产业在不同领域的应用可行性和有效性 [6] - 通过总结推广成功经验可降低发展成本并提高发展效率 [6]
城市24小时 | 中部省会“米”字形枢纽最后一笔,动了?
每日经济新闻· 2025-08-30 00:42
高铁建设规划 - 湖南省发改委公示2025年重大铁路投资项目前期工作经费支持项目 包括长沙至九江高铁 长沙西至沪昆高铁连接线 怀化至桂林高铁 荆州至岳阳高铁 岳长衡城际铁路(湘潭北至株洲西段)和兴永郴赣铁路等6个项目[1] - 长沙至九江高铁和长沙西至沪昆高铁连接线是长沙打造"米"字形高铁枢纽的关键项目 将填补长沙枢纽东北向和西南向高铁空白[1][2] - 长沙至九江高铁是长沙经九江至池州高速铁路组成部分 湘赣皖三省人大代表连续多年在全国两会呼吁建设 湖南代表团2022年 2023年及2025年连续提交全团建议请求纳入国家规划[2][3] 海洋经济发展 - 国家海洋局局长提出加强海湾经济发展规划研究 支持沿海港口群优化整合和西部陆海新通道建设 实施"一省一策"支持海洋强省建设 打造海洋经济区域增长极[5] - 规划依托主要海湾建设全国海洋经济发展示范区和现代海洋城市 提升北部 东部 南部三个海洋经济圈发展水平[5] 数据产业政策 - 贵州省出台政策支持数据产业发展 重点发展数据标注产业和云服务"首位产业" 拓展算力中心运维和算力服务业态[7] - 政策鼓励人工智能技术创新和产业应用 对通过网信部门备案的模型或算法给予支持 加快影视渲染 动漫 游戏等数字产品研发及产业化[7] 低空经济保险 - 重庆成立全国首个低空经济共保体 19家成员单位签署合作协议 与16家单位完成项目签约 风险保额达6115万元[8] - 共保体发布首批专属产品"渝低空保" 涵盖无人机第三者责任 航空产品责任 科技研发成果转化 网络安全四个保险领域[8] 人工智能发展导向 - 国家发展改革委强调发展"人工智能+"要坚持因地制宜 推动各地立足区位特点和产业基础科学确定发展重点 避免无序竞争和一拥而上[9] - 要求结合行业特点聚焦破解痛点难点堵点 挖掘人工智能赋能深层次需求和高价值场景[9] 高等教育学科调整 - 我国已完成优化调整高校20%左右学科专业布点的目标 两年间全国高校增设博士点1064个 硕士点2258个 撤销博士点27个 硕士点285个[10] - 本科专业点新增3715个 撤销和停招6638个 高职新增专业点1.2万个 撤销专业点8200余个[10] - 国家加快建设人才供需对接大数据平台指导高校学科专业结构调整 平台已进入试运行阶段[10] 城市投资价值排名 - 2025年度中国最具投资价值城市50强榜单显示深圳(95.07) 上海(94.34) 北京(93.70) 广州(92.16)包揽前四 杭州 成都 武汉 苏州 南京 重庆分列五至十名[11][12] - 榜单从经济基本面 人口与人才 基础设施等多元维度评估 呈现"东强西进 南北联动"格局 长沙位列第12名[12][13]