Data Annotation
搜索文档
人机协作中,他们教机器“读”世界
新浪财经· 2026-01-29 06:02
(来源:新华日报) □ 本报记者 周娴 实习生 任馨怡 上午9点,徐州市泉山区的江苏淮海科技城园区,江苏京数智能科技有限公司的办公区里,键盘敲击声 如潮水般准时响起。近50名年轻人端坐在电脑前,指尖重复着点击、拖拽、分类的动作——他们正通过 专业标注工具,为一张张商品图像打上精准"标签"。从商品标题、主图,到SKU(库存量单位)属性, 每一个细节都经由他们的双手,被逐一转化为机器能够理解的"语言"。他们,教会机器"读懂"世界。 数据标注行业驶入"快车道" "目前,江苏淮海科技城内已聚集20多家数据标注相关企业,规模小的不足50人,规模大的则超过200 人。"据江苏淮海科技城相关负责人介绍,这些企业的标注业务主要围绕三类通用模型展开:一类服务 于车企的自动驾驶系统,一类面向豆包、千问等大语言模型进行文本与图像标注,还有一类则专注于京 东、淘宝等电商平台的商品信息标注。 市场调研机构艾瑞咨询的数据显示,到2025年,中国人工智能数据采集与标注服务市场规模预计将突破 120亿元。在江苏,数据标注相关岗位的招聘信息遍布各地:南京某研究院招募标注工程师,月薪可达 万元,提供双休与五险一金;徐州有企业面向实习生开放岗位, ...
乐都区数据标注基地正式运营 海东将创建国家级数据标注试点城市
新浪财经· 2026-01-19 02:29
海东市数据标注产业现状 - 海东市乐都区、互助县、化隆县三大数据标注基地已投入运营,形成“乐都核心引领、互助+化隆协同支撑”的产业布局 [1] - 产业累计注册标注企业10家,建成标注工位1130个,带动就业324人 [1] - 业务范围涵盖辅助驾驶、内容安全等多个领域 [1] 乐都区标注基地具体运营情况 - 乐都区标注基地总面积2528.34平方米,设有标注工位400个 [1] - 基地构建了“采集—标注—流通—应用”全链条服务平台 [1] - 已与百度智能云、滴滴出行、科大讯飞等多家头部企业达成合作,开展内容审核及专项标注业务 [1] - 预计年标注量超过3000万条 [1] 产业带动就业与人才培养计划 - 基地以“数智赋能就业”为抓手,推进青藏高原特色数据标注培训 [1] - 计划年培育数字人才超过100人,直接带动400人实现本地灵活就业 [1] - 旨在构建“特色产业+本土人才+稳定就业”的良性循环 [1] 未来发展规划与目标 - “十五五”期间,海东市将依托乐都核心基地的产业集聚效应,全力推动县域数字经济提质升级 [2] - 以数据标注为根基,培育数据资源管理生态 [2] - 以部门、行业、产业数字化为牵引,深化数据资源资产化管理与开发利用 [2] - 目标是为成功创建国家级数据标注试点城市奠定坚实基础 [1][2]
跻身“千亿之区” 乘势再攀高峰
新浪财经· 2026-01-19 02:28
核心观点 - 云岩区在“十四五”期间实现了经济总量与质量的跨越式发展,地区生产总值突破千亿,成为贵州省经济密度最高的“千亿之区”,并确立了以数据标注产业为核心的人工智能基础产业作为未来发展的核心引擎 [8][9][10] - 区域通过系统性城市更新、现代化产业体系构建及持续加码的民生投入,实现了产业能级跃升、城乡面貌革新与居民幸福感提升,为“十五五”期间的高质量发展奠定了坚实基础 [8][11][12][13][16] - 面向“十五五”,区域制定了以发展新质生产力、建设现代化产业体系、深化改革开放等为核心的“十个新突破”战略目标,旨在推动综合实力再上新台阶 [17][18][19][20] 经济发展与产业成就 - 地区生产总值实现千亿级跨越,从“十三五”末的860亿元提升至2024年的1092亿元,“十四五”末有望达到1150亿元,年均增长约5.3%,成为全省三个千亿市、区之一 [8][10] - 将数据标注产业确立为引领区域产业升级的核心主导产业,已招引数据标注企业23家,从业人员超1200人,规划和在建工位总量达4100个,大数据与实体经济融合发展水平连续四年位居全省第一梯队 [9] - 产业结构持续优化,围绕“生产性服务业+都市新制造”方向,规划建设贵州云岩经济开发区(占全区8%国土面积)并获批省级开发区,服务全省工业的设计、检测等业态成势见效 [11] - 营商环境优化成效显著,“十四五”以来全区经营主体新增4.2万户、总量达15.41万户,“四上”企业数量突破1000家,稳居全市前列 [11] - 居民人均可支配收入突破5万元大关,连续四年领跑全省及全市 [8][16] 城市更新与面貌提升 - 推动城市更新从“碎片化改造”向“系统性提升”跨越,太平路改造提升项目获评住建部“全国城市更新典型案例”,改造后客流量较改造前增长310% [12] - 全力实施“一河一道一片”项目:揭盖复涌贯城河太平路段,贯通复现历史城垣步道,改造复兴文昌阁片区(获评省级历史文化街区),打造了文昌阁路边音乐会等文旅产品 [12][13] - 累计实施城中村改造、老旧小区升级近600万平方米,完成地下管网改造近500公里,打通7条断头路,加装150台电梯,新增1.47万个停车位,落地29个“15分钟生活圈” [13] - 生态环境质量显著提升,环境空气质量优良率达99.2%,生活垃圾转运率及无害化处理率均达100%,城市绿地覆盖率达47.97%,连续6年上榜“全国绿色发展百强区” [14] 民生保障与社会事业 - “十四五”期间累计投入超230亿元用于民生领域,确保一般公共预算支出85%以上用于民生 [16] - 就业保障有力,促进4.4万名高校毕业生留筑发展,新增城镇就业18.89万人 [16] - 教育实现历史性突破,获得全国中小学科学教育实验区等多项“国字号”招牌,在全省率先通过国家学前教育普及普惠区认定,新建、改扩建学校及幼儿园27所,新增学位两万个 [17] - 免费开放黔灵山公园,加力实施城中村、棚户区和老旧小区改造,改造总面积达470万平方米,惠及17万人 [16] “十五五”发展战略与目标 - 主要目标为实现综合实力、科技创新、改革开放、社会文明、人民生活品质、生态文明、发展安全保障“七个新提升”,到2035年与全国全省全市同步基本实现社会主义现代化 [17] - 推动现代化产业体系建设取得新突破:发展壮大创新型现代都市工业(先进装备制造、健康医药等产业链),加快发展高端型现代服务业,提升时尚型现代商贸业,创新发展优质型房地产业,全力发展融合型文化旅游产业,培育新兴产业和未来产业 [18] - 推动新质生产力发展取得新突破:做强数字产业(做活数据要素、做实应用赋能、做大产业规模),做优科技创新打造创新型城市核心区,做足人才支撑 [18] - 推动城市建设取得新突破:优化城镇空间格局,提升城市承载能力,打造品质主城样板,强化城市运行与智慧管理能力 [18] - 推动民生保障取得新突破:落实“三大抓手”巩固拓展“十五分钟生活圈”,优化“四位供给”,关爱“五类人群” [20] - 推动生态文明建设取得新突破:建设生态城区深化治理,壮大绿色工业、绿色服务业、绿色能源等生态经济,厚植生态文化 [20]
数据在身边,残疾人也能成为人工智能时代的“炼油人”
华夏时报· 2026-01-13 20:41
行业概述与核心价值 - 数据标注是人工智能产业发展的关键基础环节,负责将文本、语音、图片、视频等原始数据通过“打标签”进行处理,以供模型学习,被誉为将数据“原油”炼成“汽油”[2] - 行业正从劳动密集型加速转向技术密集型,简单重复性标注工作的60%–70%已能通过人工智能模型自动完成,从业者价值更多体现在处理新兴、高复杂度或空白领域的任务上[6][7] 市场发展与政策驱动 - “东数西算”工程持续推进,全国七大数据标注基地陆续建成,数据资源向中西部倾斜,依托地区劳动力成本优势,数据标注岗位得以大量布局[4] - 工信部印发《工业互联网和人工智能融合赋能行动方案》,提出引导龙头企业开放数据资源打造高质量行业数据集,为数据标注产业发展带来新动能[7] 就业赋能与人力资源 - 数据标注工作具有“重脑力专注、轻肢体强度”的特点,与残疾人的工作需求高度契合,吸引了越来越多残疾人参与[2] - 残疾人在数据标注工作中展现出特殊优势,例如听力障碍者视觉感知敏锐,肢体不便者手部操作稳定,脑瘫人士专注力与持久性超常,并能更敏锐地识别潜在歧视性表达以优化AI工具[3] - 行业为残疾人提供了稳定的就业机会和收入,例如宁夏的标注师韩好通过培训上岗,沈阳的脑瘫患者孙欣宇月薪约3000元并享有福利待遇,其所在公司有40多名残疾人员工[4][6] 产业模式与技能提升 - 出现“政—校—企”深度协同模式,例如辽宁京数云大数据科技有限公司作为全国首家残健融合AI数据服务基地,与科技企业及高校研发中心合作,实现人岗精准匹配[9] - 地方政府、残联与科技企业推动专项培训,例如甘肃的数据标注师培训聚焦数字图像、文本及3D点云标注等关键技术,以提升残疾人就业的可持续性[9] - 从业者需持续提升技能以应对行业转型,例如从推拿按摩师转行的王笑,通过培训成为专注于交通领域的数据标注师[9]
AI创业版黄仁勋:37岁华人0融资5年干到240亿,谷歌OpenAI都是客户
量子位· 2025-12-27 12:59
公司概况与创始人背景 - 公司Surge AI是一家数据标注公司,由37岁的美裔华人Edwin Chen于2020年创立[4][8] - 创始人Edwin Chen毕业于麻省理工学院,主修数学、计算机科学和语言学,曾在Twitter、Google和Facebook担任机器学习工程师或数据科学家[5][39] - 创始人精通多门语言,包括法语、西班牙语和普通话,其跨学科背景(语言与数学)深刻影响了公司的人才理念[19][35][37] - 公司创立时未接受任何风险投资,创始人押上了自己打工十年的全部积蓄[9] - 截至2024年,公司估值达到240亿美元,创始人凭借180亿美元身价成为福布斯400榜单中最年轻且最富有的新晋富豪之一[2][4] 创业理念与战略选择 - 创始人创业的核心理念是解决高质量人工标注数据的稀缺性问题,认为没有足够的高质量数据就无法实现AGI(通用人工智能)[6] - 公司拒绝所有风险投资,旨在完全掌握战略制定话语权,避免公司发展偏离创始人的最初设想[11][25] - 公司对资本市场保持独立姿态,明确表示对收购和上市不感兴趣[24] - 近期公司态度出现微妙变化,据悉正在洽谈一笔约10亿美元的融资,若完成估值有望升至300亿美元[32] 商业模式与市场定位 - 公司定位为高端数据标注服务提供商,其收费标准通常比市场溢价50%,极端情况下可比竞争对手高出10倍[23] - 公司早期客户包括Airbnb、Twitch、Twitter等互联网巨头,并与谷歌签署了年价值超过1亿美元的合作协议[23] - 2024年,公司营收正式超过竞争对手Scale AI,达到12亿美元[23] - 公司面临激烈的市场竞争,部分重要客户(如OpenAI)已转向其竞争对手,也有客户(如Cohere)将数据标注工作转移至内部[31] 核心技术路线与差异化竞争力 - 公司摒弃传统低附加值的数据标注模式,其核心任务是编码“人类的丰富性”,即让高学历人才将专业知识转化为AI可理解的代码[14] - 公司大幅抬高数据标注员的准入门槛,要求员工具备高等教育背景,甚至聘请博士与高校教授[15] - 公司雇佣了来自全球50多个国家的一百多万名自由职业者,负责提出难题、评估模型回答并编写标准答案[17] - 公司设计了一套与YouTube推荐机制相似的内部匹配系统,根据标注员的历史表现数据,动态分配最合适的项目[16] - 公司的差异化竞争力在于其“人才基因”,积极招募拥有“科技和人文十字路口”背景的员工,约20%的员工拥有音乐等非传统行业背景,以帮助AI捕捉复杂微妙的文化与社会语境[19][21][22] 行业挑战与风险 - 数据标注行业被认为几乎没有什么护城河,客户可以随时切换供应商或选择自研[31] - 行业面临一个根本性长期风险:如果AI继续进步,最终可能不再需要人工标注数据[31] - 竞争对手正获得大量资金涌入,并通过“价格战”争夺市场份额[28]
探索跨境“来数加工”,东莞竞逐高端数据标注新赛道
21世纪经济报道· 2025-12-05 14:27
数据标注行业发展趋势 - 数据标注是激活数据要素价值、衔接算法模型与产业应用的核心环节,正为大模型训练、自动驾驶等前沿领域提供核心支撑 [1] - 随着AI模型训练进入下半场,行业垂直模型和智能体方兴未艾,数据标注的重要性正被重新评估 [1] - 数据标注产业正从劳动密集型加速向知识技术密集型迭代,向高技术含量、高知识密度和高价值应用数据领域延伸 [1] - 简单、重复性的标注工作,60%—70%已能通过AI模型自动完成 [3] - 数据标注已从简单的人工标注,进化为处理新兴领域、高复杂度或空白领域的高技术含量优质数据产业,并将持续往高阶方向发展 [4] 东莞数据标注产业园的战略定位与布局 - 东莞正全力推进国家人工智能应用中试基地与数据产业集聚区建设,以“湾区数谷”为重要载体,率先布局高质量数据标注产业 [1] - 东莞数标园由万江街道总投资3.3亿元打造 [6] - 园区定位高端化、智能化、生态化,重点面向具身智能、工业质检、医疗影像、金融风控、遥感、AIGC等垂类高价值行业,区别于传统的通用场景领域 [5] - 园区联合中国电信、百度智能云两大头部企业,建立了百度智能云(东莞)数据标注产业基地和中国电信高质量数据集智能标注产业基地 [6] - 未来3年内,计划引进50家以上数据企业,形成30个以上高质量数据集和垂直领域大模型,集聚2000名以上高水平数据标注产业人才 [2] 东莞发展数据标注产业的竞争优势 - 东莞作为科创制造强市,拥有丰富的人工智能应用场景和深厚的工业数据积淀,其工业制造优势场景与高端数据标注需求高度契合 [1][2][8] - 东莞从高端场景入手,开辟了差异化的发展路径,能快速响应广深海量AI企业服务的需求,并依托港澳地缘和产业优势率先探索跨境“来数加工” [2] - 东莞相较广深有更宽阔、性价比更高的场地支撑,又有丰富的优质劳动力资源,通过高铁可高效对接广州高校科研资源和深圳产业创新生态 [6] - 东莞9所高校的在校大学生约17.65万人,数标园周边高校每年输出人工智能、大数据专业人才超2万人,人才储备较为充裕 [7] - 百度智能云国内首个具身智能采标实验室将落户东莞数标园,配置数采机器、机械臂、人形机器人等设备,填补大湾区具身智能高阶数据标注空白 [8] 主要参与企业与业务模式 - 东莞驰千数据公司作为百度云的数据合作伙伴,是首批入驻东莞数据标注产业园的服务商之一,专注于为各大车企提供自动驾驶数据标注服务,团队规模超过两百人 [1][4] - 百度智能云(东莞)数据标注产业基地定位为粤港澳大湾区规模最大的百度标注基地,计划招募1000名数据标注师,面向具身智能、新能源、电子信息等高端场景 [6] - 中国电信高质量数据集智能标注产业基地将搭建统一资源调度、智能中枢两大平台及多个专业应用子系统,帮助大湾区中小企业降低数字化转型门槛 [6] - 广东歌捷信息科技有限公司作为入驻服务商,计划与智能制造及工业互联网领域的本土企业展开深度合作,提供专业的AI数据标注与模型训练解决方案 [5] - 百度通过引入大模型标注、具身智能采标等高端技术和平台,帮助园区企业形成差异化、智能化、高阶化的数据标注产能,依托“数据标注—模型训练—场景应用”全链条生态吸引合作需求 [8] 市场需求与行业机遇 - 全国低端数据标注场景已经相对饱和,而高端场景尤其是工业制造领域的数据标注复杂度高,是全国面临的短板 [2] - 粤港澳大湾区的华为、腾讯、比亚迪、大疆等行业龙头企业正加速布局人工智能大模型和智能体,对高质量、专业化、场景化的数据标注需求庞大又迫切 [4] - 东莞数标基地可以高效服务湾区企业,链接全球产业链资源,为具身智能提供场景测试,满足智能驾驶数据采集需求 [8] - 园区在场地租金减免、算力券补贴等方面的大力支持,有效降低了企业的研发与运营成本,人才补贴及安置房配套政策有助于吸引和留住高质量人才 [5]
日照“五共”模式,破解数据标注人才难题
齐鲁晚报· 2025-11-14 17:56
文章核心观点 - 人工智能数据标注产业面临应用型人才紧缺和实践经验不足的挑战 日照市通过产教融合的“五共”模式探索出特色发展路径 以教育链、人才链、产业链协同发力 为产业输送稳定人才 [1] 教育链建设 - 推动8所高校设立数据标注相关专业 开发《AI数据标注技术》等实用课程 让学生在课堂学习技能 [1] - 引入企业项目进校园 通过“工学交替”让学生参与数据清洗和AI标注审核等实战 实现毕业即能对接岗位需求 [1] 人才链培养 - 在省内率先出台《数据标注产业高质量发展三年行动计划》 推进建立以企业为主导、高校为支撑的产教融合人才培养机制 [1] - 鼓励基地引进优秀团队 企业建立人才激励机制 以激发创新活力 [1] 产业链布局 - 以日照为中心辐射周边 打造“校内基地+校外园区”生态 每年为近9000人次学生提供实训 [1] - 实现“实习-就业”无缝衔接 为产业输送稳定人才 [1]
19岁亚裔女孩,做“赏金猎人”,融了1个亿
虎嗅APP· 2025-11-08 17:29
公司概况与市场定位 - Datacurve是一家成立于2024年的年轻数据标注公司,其核心产品Shipd平台采用“游戏化标注”方式,将算法题、调试任务等编程挑战打包为“通关任务”并明码标价,吸引工程师参与完成[2][3] - 公司成立一年多即累计融资1770万美元(约合人民币1.2亿元),其中2025年10月完成的A轮融资额为1500万美元,投资方包括Chemistry的Mark Goldberg以及DeepMind、Anthropic、OpenAI等AI一线公司员工[2][4] - 公司旨在挑战该领域的绝对独角兽Scale AI,后者估值已达200多亿美元,而同赛道公司Turing的估值也达到22亿美元[3] 商业模式与核心优势 - 平台通过“赏金猎人”形式与游戏化结构吸引工程师,任务被包装为“Quests”,并设有排行榜、连胜奖励与任务等级,使参与者兼具解题者和竞技者身份[10] - 平台强调“工程师优先”的社区文化,旨在为高技能参与者提供有归属感、认可度与专业认同的生态环境,而非单纯的任务派发系统[11] - 这种“游戏化+精英制”设计形成了独特护城河,平台不追求让所有人都参与,而是筛选能完成特定类型任务的顶尖工程师,从而保障数据质量[11] - 平台上线不久已支付超过100万美元的赏金,吸引了来自亚马逊、AMD等企业的高级工程师参与[15] 产品理念与冷启动过程 - 公司起点源于CEO Serena Ge在Cohere实习时意识到高质量编码数据供给是模型能力提升的瓶颈,传统标注方式无法满足模型所需的复杂度与专业性[12] - 公司将数据标注转变为具备挑战性质的题目,通过游戏化平台激励工程师贡献数据,这一理念使其成功入选硅谷最大孵化器Y Combinator的2024年冬季项目[13] - 公司始终将Shipd定位为“面向工程师的消费者产品,而不是数据标记操作”,将大量精力投入用户体验优化,确保用户“愿意来、愿意留”[15] - 商业化路径上,公司初期聚焦与高端AI实验室和工具型初创公司建立合作,包括OpenAI、Anthropic等基础模型实验室,依托早期投资人网络与口碑传播实现数据销售[15] 版权风险与合规机制 - 平台通过多层机制防护版权风险,包括贡献者原创声明、自动抄袭检测以及共识评审机制(即同行互评)[19] - 平台从源头控制任务来源,优先发布来自受控仓库的题目,避免涉及企业私有代码,部分任务要求工程师在沙盒环境中从零编写[19] - 在法律层面,公司通过“数据合同”和“许可协议”清晰定义数据的使用范围、归属权和责任边界[19] 行业竞争格局与公司对比 - 数据标注行业公司主要分为由人力资源公司转型而来(如Mercor、Turing)和新型数据公司转型而来两大类[24] - Mercor从AI招聘公司转型为数据标注服务商,依托其积累的医生、律师等专家资源,在RLHF和垂直领域标注任务方面展现出强竞争力[24][25] - Turing从远程工程师招聘业务扩展至AI基础设施服务,实现从人才服务向训练数据与人才管理一体化平台的转型[25] - Datacurve的直接竞争对手是同样走精细化高质量数据路线的Surge AI,后者采用human-in-the-loop机制,由领域专家配合定制化模型完成标注[18][25] - 公司未来计划将平台机制迁移到金融、医学、营销等垂直专业领域,以拓展业务边界[25]
37岁天才华裔,问鼎“最年轻亿万富豪”
36氪· 2025-10-10 12:06
公司核心信息 - Surge AI创始人Edwin Chen即将获得10亿美元首轮融资 公司估值或将升至约240亿美元 创始人持有75%股份 身家达180亿美元[1] - 公司成立不到五年 年营收已超10亿美元 几乎从创立首日就实现盈利[4] - 公司员工250名(包括全职、兼职和顾问) 0融资 2024年营收12亿美元 超过竞争对手Scale AI同期8.7亿美元的营收[7] - 公司客户包括谷歌、Meta、微软以及AI实验室Anthropic和Mistral等巨头 仅Meta一家生成式AI部门去年在Surge AI的支出就超过1.5亿美元[7] - 创始人Edwin Chen拒绝1000亿美元的收购报价 并将典型的由风投支持的硅谷初创公司描述为「快速致富的计划」[7][14] 商业模式与技术优势 - 公司业务为数据标注 为生成式人工智能大模型提供大量"干净、精准"的训练数据 是AI产业中最基础、最不可或缺的角色 被业内戏称为"赛博富士康" AI产业的"卖铲人"[5] - 公司采用人机协同的变通方案:由AI生成数据并自行标注 但由人类评估其表现 不同于旧式数据标注模式[7] - 公司从成立一开始就选择"高质量标注"路径 主打质量和专家匹配 希望让AI学会"人类的复杂性、人性的丰富性" 聘请斯坦福、普林斯顿和哈佛的教授来训练AI[13][15] - 公司专门搭建Surge Force精英网络 标注员需提交5道试写题目并经资深标注员审核通过后才可加入 业务围绕"隐私优先、安全第一"构建 成为医疗、政府等重视AI伦理与数据治理机构的首选供应商[14][15] 创始人背景与公司文化 - 创始人Edwin Chen出生于1988年 父母从台湾移民美国 17岁进入麻省理工学院学习数学、语言学和计算机 曾在谷歌、Dropbox、Facebook、推特等公司工作 2020年33岁时创业[9][11] - 创始人因在推特和Facebook的工作经历中遭遇数据标注质量问题(如外包商将咖啡馆标注成医院 错把"讽刺帖"标为"正面内容")而意识到高质量数据的重要性 从而创立Surge AI[11][12] - 公司创业初期就做出"反硅谷"决定:不要VC的钱 靠自有资金发展 并定下三条铁律:不融资、不烧钱、不接简单订单[14] - 产品上线不到12个月营收突破八位数 精准押中大语言模型风口 与多家巨头达成合作[14] 行业地位与发展愿景 - 数据标注公司卡住了AI的数据入口 正如英伟达掌控了算力命脉[5] - 公司希望成为一家引领AI行业发展的企业 创始人将更多地走向台前 将自己定位为更具影响力的思想领袖[8] - 在全球AI创新浪潮中 华人成为科技创新的中坚力量 《时代》杂志2025年全球百大AI人物榜单中多位华人上榜[18]
人工智能高质量数据集生态发展大会在重庆永川举行
新华网· 2025-09-29 16:41
大会概况 - 人工智能高质量数据集生态发展大会于9月28日在重庆永川举行 主题为构建高质量数据集 赋能AI新发展 [1] - 大会通过政策宣介 案例分享 揭牌签约 产业对话等形式推动人工智能数据基础设施建设 深化区域数据要素协同创新 [1] - 大会是永川区推动数据要素市场化配置改革和人工智能产业发展的重要举措 [7] 合作与基地建设 - 重庆市大数据应用发展管理局与永川区政府签署协议 共同建设重庆市数据集建设应用基地 [3] - 重庆市大数据局支持永川区企业参与重庆城市可信数据空间的数据集建设 并指导构建数据标注标准规范及质量控制体系 [3] - 西部数据标注研究院和西部数据集生产基地在大会上同步揭牌成立 [3] 机构职能与规划 - 西部数据标注研究院由中国信息协会与永川区政府共同发起 定位为数字技术共享平台 产业孵化平台及生态构建平台 [4] - 研究院将开展人工智能 高质量数据集等领域的技术科研创新 标准制定 质量评测 并培养复合型数据标注人才 [4] - 西部数据集生产基地由中国信息协会与永川区政府共建 旨在推动数据集生产类企业落地 促成数据要素汇集 打造辐射全国的数据产业 [4] 产业生态与合作 - 永川区与中国移动 中国电信等12家企业签署合作项目 与会代表围绕高质量数据集建设等话题进行深入交流 [6] - 永川区将数据标注产业作为推动数字经济和实体经济深度融合的重要抓手 积极探索数据标注+场景应用流通模式 [6] - 永川区目前园区已集聚数据标注类企业18家 建成标注坐席1.2万席 2024年相关业务营收达13.76亿元 是西南地区重要的数据标注产业基地 [6] 未来发展目标 - 永川区以建设数据要素产业聚集强区为目标 全力推进建设数据标注产业园等四大行动 [7] - 永川区力争到2027年成为成渝地区双城经济圈数据要素流通枢纽节点和数据标注服务基地 [7]