Workflow
数据标注
icon
搜索文档
“十四五”以来,天津市数据局为全市高质量发展贡献更多“数据”力量
中国发展网· 2025-12-10 15:13
文章核心观点 天津市在“十四五”期间数字经济发展成效显著,数据要素价值释放、数字经济产业增长、数据基础设施建设、城市数字化转型及对外合作均取得积极进展;未来“十五五”时期的工作将围绕推进数据要素市场化、推动数字经济创新、优化数据基础设施和深化智慧城市建设四大主线展开,以贡献高质量发展 [1][5][6] 数据要素价值释放 - 深化公共数据管理,梳理形成数据资源目录5.4万个,推出数据产品和服务30余种,并完成全国交通行业首例数据资产作价入股 [2] - “汽车行业可信数据空间”入选国家创新发展试点,“物流数据开放互联”等4个场景入选国家示范场景 [2] - 打造行业高质量数据集604个,部分应用于国家级数据服务平台和行业大模型训练;举办“数据要素×”大赛,今年全国总决赛获奖12项,位居全国前列 [2] 数字经济发展态势 - 国家批复天津开展国家数字经济创新发展试验区建设,今年前三季度数字经济核心产业规上企业营收同比增长12.3% [3] - 制造业数字化转型深化,累计打造市级智能工厂和数字化车间400家,两化融合发展水平全国前列 [3] - 互联网平台企业(灵活用工、网络货运等)营收同比增长10%;引进景烁科技、百度智能云等一批数据标注产业龙头企业,新兴数字产业基地加快建设 [3] 数据基础设施建设 - 统筹优化算力布局,智算规模超1.4万P,超算支持国家重点领域项目和成果9000余项 [4] - 国家超算互联网平台在津上线,连接国内30多家超算和智算中心,上架产品7200余款;北方首个“通智超”一体化省级算力调度平台投入使用,汇聚智能算力6000P [4] - 出台算力券政策,发放算力券涉及企业合同额2.6亿元,促进人工智能发展和产业数字化转型 [4] 城市数字化转型 - 完善智慧城市建设总体架构,推动城市治理从“分散管理”向“全域协同”转变 [4] - 统筹推动应急管理“一张图”、燃气监管平台、停车服务系统、防洪调度指挥平台等一批急用先行项目建设,加强城市运行管理 [4] 数字经济对外合作 - 成功举办2025上合组织数字经济论坛,吸引1500余人参会,促成中国与上合国家12个重点合作项目及天津21个数字经济项目签约 [5] - 中国—上海合作组织数字经济合作平台在天津揭牌成立,数智化应用联合实验室、数据跨境服务平台已投入运行,推进数字经济生态圈建设 [5] 未来工作重点 - 推进数据要素市场化价值化:加大公共数据共享开放和开发利用,加快汽车行业可信数据空间等场景建设,围绕制造业、交通运输等领域打造高质量数据集 [5] - 推动数字经济创新发展:高水平建设中国—上合组织数字经济合作平台、国家数字经济创新发展试验区,巩固壮大优势平台企业,引育创新型企业 [5] - 优化布局数据基础设施:建设数据流通利用基础设施底座,统筹算力建设和赋能应用,完善市级算力调度服务平台能力,为中小企业数字化转型提供算力支撑 [6] - 深化智慧城市建设:探索超大城市现代化治理新路径,推进政务信息化集约建设,加快一体化数据平台、数字化城市运行和治理平台等重点项目建设,提升城市治理智慧化水平 [6]
重庆解放碑CBD国际化 消费竞争力再进全国四强
搜狐财经· 2025-11-30 13:45
活动与评选 - “渝见解放碑·2025福布斯中国海外企业重庆行”活动在重庆解放碑中央商务区举行 [1] - 现场发布“2025福布斯中国中央商务区国际化消费竞争力评选”,重庆解放碑CBD再次跻身全国四强 [1] 区域发展规划与机遇 - 渝中区处于“积新成势、迭代跃升”的关键阶段,将加快建设黄花园现代服务业产业园、重庆站智创新城等重点项目 [2] - 区域大力推进14项国家级改革试点,包括“留学人才服务”,并以深耕“三个空间”、协同“四侧”、融合“四链”构筑全周期服务体系 [2] - 通过加快建设“15分钟高品质生活服务圈”完善综合配套,聚力打造宜业宜居宜乐宜游的“四宜”环境 [2] 企业合作与产业布局 - 涉及数据标注、基金投资、影视制作、智能制造等多个未来产业领域的海内外企业表达投资重庆、布局渝中的发展愿景 [2] - 香港飞翱集团、美国Apexe Global、意大利New Alimenta等企业与渝中签订共建国际消费中心城市战略合作协议 [2] 重点项目与产业孵化 - “福布斯未来产业小镇”正式启动,是继“重庆会客厅”后福布斯落地重庆的第二个重点项目 [3] - 小镇将聚焦基金集聚、产业孵化、价值共创,以“产业集群+国际资源+创新孵化”三轮驱动,打造渝中资本枢纽与产业创新策源地 [3] 高端消费与商业发展 - 专家指出解放碑CBD可推动生活文化与商业协同、完善国际化商业基建、重构生活方式消费场景,以成为西部最具号召力的高端消费地标 [4] - 圆桌对话嘉宾一致认可重庆区位优势显著,奢侈品消费潜力大,解放碑的历史底蕴和开放包容特质契合奢侈品创作 [5] - 解放碑符合国际一流商务区的建设基底和发展潜力,未来将成为重庆国际消费中心城市的重要名片 [5]
山西大同:书写推动高质量发展的“三张答卷”
人民日报· 2025-11-24 06:52
能源转型 - 原煤年产量稳定在1.5亿吨以上,2021至2024年累计生产原煤6.4亿吨,其中以长协价保供电煤4.3亿吨 [2] - 全市已建成14座智能化煤矿,先进产能占比超85%,9家燃煤电厂完成超低排放改造 [2] - 新能源和可再生能源装机容量突破1000万千瓦,占比超过56%,稳居山西省第一方阵 [3] - 产业链拓展包括活性炭精深加工、千万吨级煤矸石综合利用项目、底部换电重卡下线、独立储能项目商业化运营及抽水蓄能电站建设 [3] 算力产业 - 国家级数据标注基地建设已形成7个行业316个高质量数据集,引育企业69家,数据标注从业人员3万余人,引进本科以上人才1055人,带动相关产业产值7.5亿元 [5] - 全市算力全产业链累计投资超700亿元,投运服务器达74.5万台 [5] - 今年1至9月算力中心用电量达43.8亿千瓦时,超过2024年全年水平,预计全年用电量将突破60亿千瓦时,城市算力分指数连续两年稳居全国前三 [5] - 数据局汇聚31个部门的业务系统数据,覆盖城管、文旅等领域,包含1543张数据表、69.73亿条数据,并于2025年8月入选国家数据基础设施建设先行先试名单 [6] 文化发展 - 今年国庆中秋期间,全市重点监测的8家景区累计接待游客152万人次 [7] - 节日期间推出系列文化活动,包括8000架无人机展演、大型交响音乐会、器乐演奏、魔术变脸、国潮展示等 [8] - 文化底蕴源于2000多年建城史,拥有云冈石窟、悬空寺、长城等世界级文化遗产 [8]
东北三省共建数据标注产业集群
辽宁日报· 2025-11-23 08:48
产业战略规划 - 辽宁、吉林、黑龙江三省将共建具备全球竞争力的数据标注产业集群,并谋划组建东北数据标注解决方案联合体 [1] - 东北地区将以专业化、智能化、国际化为导向,通过政府引导、企业主体、市场运作的协同共建模式,构建区域性产业集群体系 [2] - 联合体将整合各地资源和优势,为全国客户提供全栈式、高价值的解决方案,并联合开拓应用场景 [2] 产业发展现状 - 沈阳市作为国家级数据标注基地之一,已标注数据总量超过8323TB,形成134个高质量数据集,应用于76个大模型 [1] - 沈阳市参与制定国家标准2项、行业标准4项,引育数据标注企业65家,从业人员达1.18万余人,产业规模约25.9亿元 [1] - 产业加快数据要素价值释放,已交易数据集28个,交易金额达1.02亿元 [1] 应用与生态建设 - 数据标注被定义为人工智能训练过程中的关键环节,是将数据“原油”炼成“汽油”的关键工艺 [1] - 联合体将“打包”东北的工业、农业、文旅等全域产业升级需求,为区域内标注企业提供试验田和首用地 [2] - 目标是建设覆盖东北亚的数据标注产业,形成专业化分工协作、互联互通的产业生态 [2]
19岁,A轮公司掌门人
投中网· 2025-11-11 08:53
文章核心观点 - 高质量数据标注正成为AI产业链中竞争激烈的关键赛道,多家初创公司获得高额融资和估值 [6][7] - 新兴数据标注公司通过平台化、社区化和游戏化模式重构传统业务,吸引高素质专业人士参与,以解决AI模型训练对专家级数据的迫切需求 [9][10][13] - 资本对数据标注领域给予高估值,反映了市场对“数据即服务”基础设施潜力的押注,但行业也面临技术自动化替代和利润率的现实考验 [16][17] AI数据标注行业现状与竞争格局 - 在AI算力和算法竞争被巨头垄断的背景下,高质量人工标注数据成为创业公司能切入的少数机会之一 [7] - 海外数据标注公司成为资本布局重点,Meta斥资14.3亿美元入股Scale AI使其估值达290亿美元,Surge AI计划以250亿美元估值融资10亿美元 [7] - 数据标注本质是将非结构化数据转化为机器可理解的结构化数据,随着强化学习重要性提升,对精细标记数据集的需求和预算激增 [12] 新兴公司的商业模式创新 - Datacurve采用“赏金猎人”系统,通过平台Shipd吸引全球熟练软件工程师参与数据任务,每任务奖励5至50美元,拥有超1400名注册工程师,累计发放赏金超100万美元 [10] - 公司成立两个月即实现营收破百万美元,为全球超一半基础模型实验室及Facebook、苹果等企业提供高质量代码数据 [10] - Surge AI搭建高技能承包商网络,通过技术体系进行质量控制和流程优化,已与超100万名承包商合作,向谷歌、Anthropic等公司出售数据集 [13] - 新模式将低附加值行业“产品化”,让专业人群以兴趣和挑战感参与,创建可扩展的数字经济服务 [13] 资本市场表现与估值分析 - Scale AI在2024年营收约8.7亿美元,估值290亿美元,市销率约33倍;Surge AI同年营收超10亿美元,目标估值150亿至250亿美元,市销率约15至25倍 [16] - 高估值反映投资人对公司“数据基础设施化”潜力的押注,而非当前盈利能力,其客户包括OpenAI、Anthropic等核心实验室 [16][17] - 行业面临利润率考验,Scale AI 2024年净利润不足1亿美元,人力与审核成本制约利润空间 [17] 行业未来发展趋势与挑战 - 独特、垂直、难以复制的数据资源是AI企业构建护城河的关键,未来竞争在于将数据转化为模型可理解知识的速度 [18] - 如果AI自监督学习、自动标注技术提速,对人工标注的依赖可能被削弱,这是一个既永恒又脆弱的生意 [17] - 与中国以项目制服务为主的产业形态不同,美国平台化、SaaS化模式获得更高估值,但商业模式在国内不易获得资本青睐 [17]
两人能抵上万人,际数科技自研算法服务人工智能大厂车企
长江日报· 2025-11-11 08:37
公司技术与效率 - 公司通过自研的空间智能模型平台实现数据标注自动化,仅需两人即可完成相当于上万名数据标注师的工作量[1] - 传统人工标注师一小时可完成240件数据标注,而公司的全自动标注系统一小时可完成360万件,效率提升显著[6] - 公司的核心技术源于创始人在测绘领域的算法研究,该算法曾获得中国测绘科技进步奖一等奖[6] 公司业务与客户 - 公司数据来源包括合作车企采集的视频以及北斗卫星地图数据供应商拍摄的图像,数据更新频率维持在一个月左右[10] - 公司服务的客户包括吉利、奇瑞等大型车企,以及商汤、博世等人工智能企业[10] - 公司近期获得青山产投集团数千万元投资,计划将服务区域从长三角扩展至全国[10] 行业背景与政策支持 - 2023年国内从事数据标注的企业众多,但运用智能模型进行全自动标注的企业较少[6] - 测绘技术融合了卫星定位、遥感、地理信息系统,能精确识别物体属性、位置和状态,在恶劣天气或复杂路况下优势明显[7] - 武汉市出台数据标注产业发展三年行动方案,目标引进培育龙头企业,带动人工智能相关产业规模增量超过100亿元[10] 未来发展规划 - 公司计划从空间智能服务向具身智能等前沿应用场景探索,利用工业场景如炼钢车间、化工厂生产车间进行技术迁移[10] - 通过持续的图像标注,公司旨在提升机器人的智能水平,使其成为工厂的高效助手[10] - 公司将总部迁至武汉并计划招聘30人,依托当地产业政策支持加速发展[6][10]
未来产业:数据要素和交易
2025-11-07 09:28
行业与公司 * 行业为数据要素与人工智能产业 公司提及海能生等数据标注龙头企业[1][9] 核心观点与论据 * 数据要素是人工智能产业发展的三大关键要素之一 是重要的战略资源和底层基础设施[2] * 国家高度重视数据要素 自2022年12月起出台多项纲领性政策文件 并于2023年初成立国家数据局进行专门管理[1][2][4][5] * 建设全国统一大市场是核心目标 数据资源的流通、交易和确权是其重要组成部分[1][2] * 数据标注行业发展迅速 国家已统筹建设七大高质量数据标注基地 数据集总规模达29TB 带动相关产值超过83亿元[1][6] * 人工智能应用规模快速增长 2025年初至6月底 我国日均Token消耗量从约1,000亿增长至超过30万亿 增长超过300倍[1][8] * 大模型训练中中文数据占比超过60% 部分模型达到80% 高质量中文数据集开发空间巨大[1][9] * 2025年10月政策文件指出工业制造、现代农业等9个领域的数据要素典型应用场景 各行业对数据要素有强烈需求[1][10] * 公共数据的开发利用至关重要 能提高社会治理效率 需通过合理机制打通公安、医疗、运营商、金融等不同部门的数据[1][10][12] 其他重要内容 * 数据要素产业投资热点方向包括数交所、人工智能及医保、交通、能源等具体应用场景探索[8] * 在人工智能时代 模型调用的Token数是衡量应用受欢迎程度和市场潜力的重要指标[1][8] * 北京、上海、天津等城市在试点数据作价入股模式 将高质量数据集折算成股权投入企业 上半年数据集相关交易额接近40亿元[8] * 算力基础设施建设与数据密切相关 国家推进数据中心建设和分布式计算技术发展[9] * 广东、上海、福建、浙江等省份有望在数字经济发展中领先 地方国有企业和掌握高质量数据资源的龙头公司将形成协同优势[3][11] * 上市公司积极参与数据要素应用探索[3][11]
日照推进产教融合打造数据标注产业人才供给“蓄水池”
齐鲁晚报· 2025-11-07 00:21
文章核心观点 - 日照市通过“教育链—人才链—产业链”三链深度融合模式构建数据标注产业人才供给体系以解决行业人才紧缺问题并推动产业高质量发展 [1][2] 教育链与产业链对接 - 日照市推动8所高校针对性开设数据标注相关专业并定制《多模态数据处理》等实用课程使教学内容贴合产业需求 [1] - 企业通过共建产业学院和引入真实标注项目让学生在校内基地参与数据清洗和标注审核等全流程操作实现学习与实践无缝衔接 [1] 人才链与产业链支撑 - 日照市通过制定数字人才培育专项政策明确人才培育方向为企业提供适配的人才储备 [1] - 企业建立表彰奖励机制对表现突出的标注人才和团队给予奖励以吸引外部人才并留住本地骨干力量 [1] 产业链对教育链的反哺 - 以泰盈科技和中开科技为核心的实训基地每年承接近9000人次学生实习实训将产业一线最新需求反馈给高校以优化课程设置 [2] - 产业反馈帮助高校调整教学重点最终形成“人才培养—就业上岗—产业升级—反哺教学”的闭环生态 [2] 未来发展规划 - 日照市计划进一步强化产教融合特色生态通过“三链融合”模式持续输送优质人才全力打造数据产业新增长极 [2]
建设高质量数据集,江苏势在必行、必须先行
新华日报· 2025-11-06 16:16
大会概况与成果 - 2025全国高质量数据集和数据标注产业供需对接大会于11月5日在南京成功举办 围绕大模型训练和行业智能化转型数据需求设置了5个行业供需对接专场 吸引国内500余家企业参与 现场达成合作90余项 交易额超9亿元 [1] - 大会是全国首个高质量数据集和数据标注产业供需对接大会 首次试水即火热出圈 [1] 江苏省数据资源与政策支持 - 江苏省是数据要素资源大省 截至今年10月底在医疗、交通、工业、能源、文旅等重点领域形成高质量数据集321个 数据总规模超93PB 相当于9300万部高清电影 [1] - 江苏省构建1+N的人工智能高质量发展政策体系 在算力、算法、数据和人工智能应用上系统发力 [2] - 江苏省数据局等八部门联合印发《江苏省发展数据标注产业建设高质量数据集实施方案(2025—2027年)》 把数据标注和高质量数据集一体统筹 聚焦17个领域引导供需企业协同推进高质量数据集建设 [2] - 江苏省会同八部门印发《江苏省培育壮大数据企业行动方案(2025—2027年)》 开展涵盖数据资源等6类数商引育工作 加快高质量数据集生态圈建设 [2] 高质量数据集的定义与标准 - 高质量数据集数据量不一定很大但一定要精 关键标准是符合AI大模型训练需要 在不同行业中定义标准不一 [2] - 中国电子技术标准化研究院在全国数标委推动下正式发布4项高质量数据集系列技术文件 包括建设指南、格式要求、分类指南、质量评测规范 通过标准化方式解决建设面临的突出问题 [6] - 我国正按照1+3+5+N的思路推进高质量数据集基础设施化 依托1个管理服务平台 从3个层次推进 通过5类建设主体 以N个典型应用场景为牵引建设高质量数据集 [6] 数据标注的挑战与重要性 - 数据标注至关重要 是找特征和找意外情况的过程 例如在智能驾驶中标注风险点以提升安全性 [3] - 数据标注有专业门槛 普通视频和2D照片易于上手 但鸟瞰图、三维图需要数学知识 医学类数据标注需要较高水平的专业知识 [3] - 细分领域大模型进展缓慢的原因包括数据供给不足和加工能力不足 行业渴盼高水平、专业性强的数据标注师队伍 [4] 行业面临的成本与融资问题 - 高质量数据集建设面临存储成本高企的问题 持续增长的数据采集总数与居高不下的存储成本并存 企业自建存储中心或租赁第三方云存储服务均产生成本 [5] - 企业呼吁在数据采集端和标注端加大金融扶持力度 建议金融机构对有市场价值的高质量数据集以订单贷或信用贷等形式发放启动资金 一个价值100元的数据集中80元是采买原始数据的成本 [6] - 数据行业是知识密集型叠加资金密集型的行业 融资成本制约企业做大做强 [6] 未来发展路径与解决方案 - 为降低数据存储成本 企业建议在我国中西部地区建设冷存储中心 对暂时用不到的数据进行低成本保存 [5] - 江苏省未来将围绕高质量数据集价值实现从供需两侧发力 编制数据富集领域建设指南和数据标注产业图谱 加快数联网、可信数据空间试点及公共服务平台建设 [7] - 江苏省计划强化中小企业培育 推动省级资源与地方需求精准匹配 组织供需对接会支持企业加速高质量数据集构建和应用转化 [7]
业界专家学者、行业精英聚首江苏扬州 共绘数字文旅新图景
中国新闻网· 2025-11-05 14:36
大会概况 - 全国高质量数据集和数据标注产业供需对接大会在江苏扬州举行,业界聚焦数字文旅新图景 [1][3] 数据要素与文旅产业融合 - 数据作为新型生产要素是驱动高质量发展的核心引擎,文化旅游产业是高质量数据集建设的天然富矿和数据标注技术应用的广阔舞台 [3] - 大会共商数据要素与文旅产业深度融合之道,被认为正当其时且意义深远 [3] 扬州数字经济发展优势 - 扬州数字经济动能澎湃,数字基础扎实稳健,数字治理融合创新 [3] - 扬州智算规模超28EFLOPS,占江苏省40%以上,被字节跳动确定为全国核心节点之一,算力能力居江苏第一、全国前列 [3] - 扬州构建算力“一张网”,运河城市算力平台汇聚9座城市24个算力资源池,接入超万PFLOPS算力资源,实时调度算力超2000PFLOPS [3] - 主办方选择在扬州举办大会是看中其“算力+数据”双重优势 [3] 数据标注与高质量数据集发展 - 发展数据标注产业、打造高质量数据集是卡位人工智能发展、抢占AI科技革命新高地的重要一环 [4] - 高质量数据集建设要以场景锚定价值坐标,数据标注产业发展要以技术与标准破解瓶颈,并以可信互联、价值共生打造协同发展生态 [4] - 需求方应主动传递场景细节并提供精细化需求指导,供给方应从“供给数据”向“供给知识”转变 [4] 产业合作与生态建设 - 江苏省文化和旅游厅邀请业界在江苏数字文旅领域开展深度合作,为文旅高质量发展注入新活力 [4] - “全国数据标注产教融合发展基地”正式成立,中国电子云、科大讯飞等首批企业入驻 [5] - 发布“文化旅游高质量数据集行业共建扬州倡议”,围绕共研统一标准、共促有序流通、共筑生态底座、共创应用价值四个方面推动打破文旅数据壁垒 [5] 大会成果发布 - 大会发布18项行业高质量数据集,内容涵盖文旅行业垂直数据集、乐器及音教行业音频标注数据集、苏州丝绸纹样数据库、无锡文脉系列数据集、地方志高质量数据集、“下扬州”大模型数据集等多个前沿领域 [5] - 举行一批重点项目集中签约,聚焦数字经济与文旅深度融合,涵盖平台建设、总部引入与智能服务等多个关键领域 [5]