Workflow
人工智能数据服务
icon
搜索文档
海天瑞声2025年度归母净利润1407.45万元 同比增加24.16%
智通财经· 2026-02-27 17:00
公司业绩表现 - 2025年度实现营业收入37,697.20万元,较上年同期增长59.00% [1] - 归属于母公司所有者的净利润为1,407.45万元,较上年同期增加24.16% [1] 业务增长驱动因素 - 全球人工智能产业从“技术突破”迈向“规模化落地”,公司训练数据业务迎来强劲增长 [1] - 视觉业务收入增长超过200% [1] - 文本业务收入增长超过100% [1] - 语音业务收入亦保持合理水平 [1] 行业趋势与增长动能 - 国内外科技巨头加速全球纵深布局,带动各类模态的多语种数据爆发增长 [1] - 视觉大模型持续突破,推动高精度、场景化视觉数据投入持续加码 [1] - 交互体验迈向拟人化,多情感、多角色、多音色的语音数据需求持续释放 [1] - 垂直行业渗透加速,文旅、医疗、教育等领域垂类大模型落地提速,专业化、场景化数据需求日益凸显 [1]
海天瑞声(688787.SH)2025年度归母净利润1407.45万元 同比增加24.16%
智通财经网· 2026-02-27 16:55
公司2025年度业绩表现 - 2025年度实现营业收入37,697.20万元,较上年同期增长59.00% [1] - 2025年度归属于母公司所有者的净利润为1,407.45万元,较上年同期增加24.16% [1] 业务增长驱动因素 - 全球人工智能产业从“技术突破”迈向“规模化落地”,公司训练数据业务迎来强劲增长 [1] - 视觉业务收入增长超过200% [1] - 文本业务收入增长超过100% [1] - 语音业务收入亦保持合理水平 [1] 行业趋势与增长动能 - 国内外科技巨头加速全球纵深布局,带动各类模态的多语种数据爆发增长 [1] - 视觉大模型持续突破,推动高精度、场景化视觉数据投入持续加码 [1] - 交互体验迈向拟人化,多情感、多角色、多音色的语音数据需求持续释放 [1] - 垂直行业渗透加速,文旅、医疗、教育等领域垂类大模型落地提速,专业化、场景化数据需求日益凸显 [1]
海天瑞声(688787.SH):2025年净利润为1407.45万元,同比增加24.16%
格隆汇APP· 2026-02-27 16:16
公司2025年度业绩快报 - 2025年度实现营业收入37,697.20万元,较上年同期增长59.00% [1] - 归属于母公司所有者的净利润为1,407.45万元,较上年同期增加24.16% [1] - 归属于母公司所有者的扣除非经常性损益的净利润为1,116.65万元,较上年同期增加124.52% [1] 训练数据业务增长情况 - 报告期内公司训练数据业务迎来强劲增长 [1] - 视觉业务收入增长超过200% [1] - 文本业务收入增长超过100% [1] - 语音业务收入亦保持合理水平 [1] 行业发展趋势与增长驱动因素 - 全球人工智能产业从“技术突破”迈向“规模化落地” [1] - 国内外科技巨头加速全球纵深布局,带动各类模态的多语种数据爆发增长 [1] - 视觉大模型持续突破,推动高精度、场景化视觉数据投入持续加码 [1] - 交互体验迈向拟人化,多情感、多角色、多音色的语音数据需求持续释放 [1] - 垂直行业渗透加速,文旅、医疗、教育等领域垂类大模型落地提速,专业化、场景化数据需求日益凸显 [1]
海天瑞声:2025年净利润1407.45万元,同比增长24.16%
新浪财经· 2026-02-27 15:45
公司业绩概览 - 2025年度实现营业总收入3.77亿元,同比增长59.00% [1] - 2025年度实现净利润1407.45万元,同比增长24.16% [1] 业务表现分析 - 训练数据业务整体迎来强劲增长 [1] - 视觉业务收入增长超过200% [1] - 文本业务收入增长超过100% [1] - 语音业务收入保持合理水平 [1] 行业发展趋势 - 全球人工智能产业正从“技术突破”迈向“规模化落地”阶段 [1]
海天瑞声:公司持续为境外多家头部科技大厂的全球人工智能产品的本地化及出海提供关键的数据支撑
证券日报· 2026-02-26 21:37
公司业务与市场定位 - 公司持续为境外多家头部科技大厂的全球人工智能产品的本地化及出海提供关键的多语种、多模态数据支撑 [2] - 公司正在持续获取并交付此类项目,从而推动境外数据业务的快速发展 [2] 市场需求驱动因素 - 随着全球化AI应用场景的快速落地,市场对高质量、多语种、场景化训练数据的需求持续提升 [2] 核心产品与服务 - 多语种语音识别数据:服务于智能助手、客服机器人等产品的全球化部署与口音适配 [2] - 多语种手写体数据:支持金融票据识别、表单处理、手写笔记数字化等应用在不同语言文字区域的准确理解 [2] - 多语种文本数据:涵盖自然语言理解、内容审核、机器翻译等任务所需的多语言文本语料库 [2] 公司核心能力 - 公司凭借在多语言、多模态数据处理领域长期积累的全球供应链管理能力和技术know-how [2]
海天瑞声:公司已组建具身智能数据专项团队开展相关业务
证券日报· 2026-02-26 21:37
公司业务布局 - 公司非常看好具身智能数据领域作为高增长的新兴赛道,已组建具身智能数据专项团队开展相关业务 [2] - 公司已开始在全国多个城市启动专项公司的选址 [2] - 公司已与多家机器人本体厂商展开合作,并与若干家头部科技大厂及地方政府启动订单需求对接 [2] - 公司正在推进相关样例数据交付与训练场方案的设计与落地,为下一步具身智能数据业务的加速发展奠定坚实基础 [2] 行业市场前景 - 国家已将具身智能列为未来产业予以重点培育 [2] - 控制机器人认知决策等“大脑”仍处于发展早期,大模型在泛化能力上仍有不足,因此想实现规模化落地将依赖大量高质量、细颗粒度的训练数据,因此这一领域市场潜力巨大 [2] - 当前,国内、外多家头部科技企业已启动具身智能数据的规模采购,需求涵盖机器人在真实场景下的交互数据、构建仿真世界模型所需数据等 [2] - 部分地方政府也在积极规划建设“具身智能训练场”,旨在工程化生产高质量具身数据,赋能科研与产业应用 [2]
独家解读|2025年AI五大趋势与底层数据革命
机器之心· 2026-01-06 17:38
文章核心观点 - 2025年人工智能的发展重心正发生根本性转移,从追求模型规模转向构建其理解与解决复杂现实问题的能力,高质量数据成为定义AI能力的新基石[1] - 数据堂作为人工智能数据服务的前沿探索者,深度参与并支撑着这场变革的每一个关键环节[1] 趋势一:多语种TTS与全双工交互 - 语音合成技术正同时向两个深度智能化维度演进:一是为合成语音注入情感、个性与文化适配性;二是从单向反应升级为支持实时打断、重叠对话与上下文连贯的全双工自然交互[3] - 训练数据的重心正经历双重跃迁:一方面需构建服务于音色、韵律、情感和风格精细控制的“表现力语料库”;另一方面为实现全双工交互,迫切需要多通道、真实、带有自然打断与话题转换的对话语音数据[4] - 数据堂提供可直接用于模型训练的成熟数据集,包括100万小时多语种自然对话语音数据集、300万条前端文本库、2000小时多情感普通话合成数据集以及1万小时全双工多语种自然对话数据集[7] - 依托覆盖全球200+语种及方言的庞大语音资源网络与专业声优库,数据堂能够为各类定制化项目提供强大支持[7] 趋势二:多模态大模型 - 以DeepSeek-OCR模型的开源为标志性事件,揭示了多模态大模型发展的核心方向:推动AI从处理单一模态信息,迈向对图像、文本、表格、图表、GUI界面等多元信息进行统一理解、关联分析与深度推理的新阶段[9] - 训练数据必须能够刻画不同模态元素之间的复杂关联与深层语义逻辑,朝着跨模态语义对齐、深度结构化与语义图谱化的方向演进[10] - 数据堂提供覆盖多模态认知全链条的高质量数据,包括千万级OCR数据、百万级GUI界面、多领域专业文档、300万组涵盖动作、场景、建筑等的图文理解数据,以及20万组OCR问答及图像视频编辑数据[12] 趋势三:大模型的深度演进 - 当前大模型的发展呈现出两条清晰且并行的路径:一方面持续追求更强大的通用推理与复杂常识能力;另一方面驱动模型向金融、法律、生物医药等垂直领域深入,追求高度的专业精度与可靠性[14] - 高质量训练数据的需求正高度集中于金融、法律、生物医药及科学研究等知识密度高、容错率低的专业领域,核心已转变为获取能直接赋能模型专业推理与精准判断能力的关键数据资产[15] - 数据堂提供从标准化数据产品到深度定制服务的完整解决方案,包括5000万条新闻文本、3亿条STEM试题等高质量无监督数据,以及70万组指令微调与150万条安全内容等SFT指令微调数据[17] - 数据堂组建了覆盖十余个领域的超500人专家团队,已成功支持超100个大模型数据项目[17] 趋势四:具身智能 - 具身智能成为2025年焦点,旨在突破传统大模型缺乏物理交互经验、无法建立真实世界因果认知的本质缺陷[19] - 具身智能的核心在于让AI通过数据习得物理世界的因果规律,这需要严格对齐时序的高维交互数据,完整融合多视角视频、高精度力/触觉传感器流、动作指令序列及最终任务结果[20] - 数据堂提供从标准化数据集到深度定制采集的完整服务,目前已构建数亿组3D环境数据、第一人称任务视频、机器人抓取数据集等在内的完整体系[22] - 数据堂在全球布局超过20个专业采集场,单个面积最大超4000平方米,部署有包括人形机器人、机械臂、机械狗在内的70余台各品牌机器人[22] - 数据堂专业标注平台与团队能够完成从感知数据的目标检测、分割,视频分割,任务描述,COT等全类型标注任务[23] 趋势五:自动驾驶的技术范式转移 - 2025年,自动驾驶系统正经历一场深刻的技术范式变革,核心架构正从传统的“感知-规划-控制”模块化设计,向数据驱动的“端到端”一体化模型演进[25] - 新一代的VLM/VLA多模态大模型路径提出了颠覆性需求,训练数据必须实现视觉、语言与行动三者在时序上的精细对齐与深度耦合,催生了对高质量、强逻辑的标注数据的极度依赖[26] - 数据堂能够对驾驶场景同步执行端到端的精确坐标标注与粗粒度的语义说明标注,并融合场景描述、决策依据、反思过程等深度逻辑,构建“感知-决策”闭环的训练数据对[28] - 基于高效的标注工具及成熟的流程管理,数据堂具备稳定的规模化标注产能,其中车辆路线判断与行驶意图等关键任务的量产交付能力均达到每月40万组[28]
从实验室到交易所,北京五年诞生了200家上市公司
贝壳财经· 2025-11-27 10:21
北京科创企业“十四五”发展成就 - 三元基因从单一产品药企成长为平台型创新药企,实现跨越式发展[2] - 海天瑞声从数据供应商升级为AI模型落地的端到端解决方案伙伴,资产规模从5亿元增至近9亿元,营收连续保持24%以上增速[7] - 海博思创成为科创板储能集成第一股,从2011年海淀区起步,成立半年即获1500万元天使轮融资[4][10] - 三元基因上市后研发投入占比连续四年超20%,专利数从28项增至52项,集采覆盖29个省份、6000余家医院,经营性现金流净额2024年同比增长63.23%[8] - 海天瑞声完成智能化平台建设与公司战略升级,形成北京创新+全球供给格局[7] - 三元基因核心管线RSV雾化吸入剂完成全球首个Ⅲ期临床,乙肝功能性治愈药物进入关键临床阶段,并拓展人源胶原蛋白等消费医疗赛道[8][9] 北京市创新环境与政策支持 - 北京市“十四五”期间独角兽企业数量连续四年全球城市第三,R&D经费投入强度保持在6%,基础研究经费占比保持在16%[5] - 北京市每天新设立300多家科技企业,密度超越硅谷,截至2024年底独角兽企业达115家,国家级专精特新小巨人企业累计认定1035家,均居全国首位[11] - “十四五”期间北京实现直接融资超5.6万亿元、居全国首位,新增境内外上市公司200家[11] - 北京通过专精特新企业培育体系、科技专项、首台套政策等分层精准扶持科创企业[14] - 北京提供设备租赁补贴、创新药临床资金支持、开放创新平台等政策,助力企业研发[17] - 北京一网通办、一站式服务降低企业资质申报、合规咨询成本,提升时间效率[18] 北京产业集群与资本市场表现 - 截至2025年9月底,北京辖区沪深上市公司达453家,注册制下近130家企业聚集于新一代信息技术、生物医药、高端装备制造等支柱产业[19] - 北京上市公司中战略性新兴产业企业占比超七成,超55%属于国家级专精特新小巨人企业[19] - 北京已形成新一代信息技术、科技服务业、医药健康三个万亿级产业集群,以及智能制造和装备、人工智能等七个千亿级产业集群[25] - 截至2025年11月26日,北京A股上市公司中生物产业35家(占比7.31%)、新一代信息技术产业27家(占比5.64%)、新能源汽车产业3家(占比0.63%)[36][38] - 北京建设金融综合服务网近6年,累计服务中小微企业近2000万家次,聚力解决融资难题[26] “十五五”规划与未来发展方向 - 北京“十五五”规划建议提出实施产业创新工程,推动新技术新产品新场景大规模应用,加快集成电路、机器人和智能制造、智能网联汽车、空天技术等战略性新兴产业发展[22] - 规划明确扩大新一代信息技术、医药健康产业集群优势,培育人工智能、绿色先进能源和低碳环保等新产业集群[22] - 三元基因目标“十五五”末实现年营收突破15亿元,推动中国基因工程药物品牌走向国际[22] - 海天瑞声目标成为北京AI产业集群中的重要一员,成为多个重点产业数字化升级中的数据底座和可信伙伴[20] - 北京发布“并购19条”,支持企业通过并购重组上市,为科技独角兽提供快速通道[40][41] - 专家建议北京从创新资源高地迈向创新生态高峰,推动产业链、供应链、创新链深度融合[28][29][45]
公司问答丨海天瑞声:谷歌、阿里一直以来是公司的重要客户 公司为其提供AI训练数据
格隆汇· 2025-11-24 17:35
客户关系 - 谷歌和阿里巴巴是公司的重要客户 [1] - 公司为谷歌和阿里巴巴提供AI训练数据 [1] 信息披露 - 关于阿里巴巴在公司主营业务收入中的具体占比,公司表示将依据交易所法规履行信息披露义务 [1] - 相关信息需关注公司发布的正式公告 [1]
核数聚总部吴中新址启用,共启AI数据产业新征程
江南时报· 2025-11-10 16:26
公司发展与定位 - 公司于2023年落户苏州吴中 已成长为团队规模近千人的数据行业龙头企业[1][2] - 公司成为国内少数兼具AI全栈能力且能贯通语音、智驾、大模型三大关键领域的头部数据企业[1] - 公司成功服务Momenta、博世、商汤、联想、思必驰等行业标杆客户 是国内人工智能数据服务的领军企业[1] 新产品发布与技术突破 - 发布"标注2.0数据平台"和"数据引擎"两款新产品[1][2] - 标注2.0平台采用AI预标注+人工精修模式 AI算法生成标注初稿 预处理准确率超80%[2] - 新平台较标注1.0时代提升70%以上 创新人机协同范式为AI模型训练提供更高效精准的数据支撑[2] 战略合作与生态构建 - 公司与吴中金控、善达资本等进行"投融资意向签约" 与苏州大学等多所高校签署战略合作协议[3] - 签约内容包括"数据引擎战略合作"、"高技能实训基地"、"共建数据要素研究中心"等多项合作[3] - 公司将携手产业链上下游企业及高校院所构建协同创新生态 为工业、医疗、智慧交通等重点行业深度赋能[3] 未来战略规划 - 公司未来将始终聚焦AI核心数据领域 以高质量数据集建设为根基 依托可信数据空间[2] - 公司将通过数据飞轮、合规飞轮、合成飞轮构建高质量数据发展闭环 推动数据资产化与产业智能化升级[3] - 公司将持续深耕语音、智驾、大模型等核心赛道 依托"数据+引擎"双轮驱动模式[3]