Workflow
多模态数据
icon
搜索文档
海天瑞声20251031
2025-11-03 10:36
公司概况 * 公司为海天瑞声 专注于AI数据服务[1] 财务表现与预期 * 2025年第三季度收入为7,764万元 同比增长36%[3] * 第三季度收入增速放缓至30% 主要因部分国央企项目确收延迟[7] * 全年收入增速预计与前三季度持平 保持在57%左右 全年业绩表现依然强劲[2][7] * 预计未来两到三年公司年均复合增长率能达到40%至50%[16] 战略布局与核心业务 政府与国央企合作(G类业务) * 公司与中移动等战略性股东合作 对接成都 长沙 保定等国家级数据标注基地[2][3] * 预计2025年第四季度完成成都和长沙数据集交付 总量达数百万条[2][3] * 与广西政府合作建设面向东盟国家的权威语料库 预计2026年交付东盟五国数据 收入达2000万元[2][4] * 东盟语料库类业务占三季度境内单季收入的15% 全年占比将提升至境内总收入的40%左右(约8,000万元)[4] * 公司与约十几家央企合作 包括中国移动 中国联通 中国电信等 参与国家级AI焕新社区项目[3][8] * 在地方政府数据要素产业化方向已成立7个子公司并成功交付项目[8] 传统客户与市场需求 * 传统客户为国内外科技大厂 需求集中在多语种 高端专业化及提升交互自然度的数据[2][5] * 公司已在这些领域进行布局 以满足客户对多语种语音识别 手写体 文本数据等的需求[2][5] 新兴业务拓展 * 海外内容审核业务:运营菲律宾基地(规模约1,500人) Q3贡献收入约2000万元[2][6] 该基地今年贡献收入超过7,000万元[14] * 具身智能领域:成立具身智能事业部 与机器人本体公司 科技企业及地方政府合作 提供高质量训练数据集服务[2][6] 已有国内民营科技巨头释放大量需求 预计明年中报收入达千万级别[10] * 多模态数据技术:为快手可灵等提供高端数据服务 Q3仅快手就贡献收入近1,500万元[3][11][12] 多模态数据处理需求正不断增加[13] 重要合作伙伴与项目 * 与华为合作始于升腾系 通过军团制销售算力[3][9] * 首个落地项目为陕西文旅集团"博观大模型" 验证华为提供算力 海天负责数据和算法应用的模式[3][9] * 该模式已在北京门头沟区复制(涉及2000个数字人形象) 计划推广到更多垂直领域和省份[9] 其他重要信息 * 公司认识到海外自主可控交付能力的重要性 计划扩展至印尼市场 并与当地院校合作招募专家级标注员以承接北美高端定制化业务[14][15] * Deepseek在文本处理上的创新突破提升了OCR数据需求 未来含有文字的多模态数据处理需求将会增多[13]
破解机器人产业瓶颈,北京这个训练中心年产百万数据
北京日报客户端· 2025-08-16 09:20
人形机器人数据训练中心概况 - 北京首个人形机器人数据训练中心位于首钢园,占地3000平方米,每年可产出超百万条高质量多模态数据[1] - 中心划分为"九年一贯制"训练区和"机器人大学"场景区,覆盖家庭康养、特种作业、新零售等十大实景应用场景[1] - 中心部署108台形态多样的机器人,包括具身双臂升降机器人、轮式人形机器人、单臂无人机等,实时采集动作数据[1] 数据对机器人行业的重要性 - 高质量、多样化、贴近真实世界的多模态数据是训练机器人AI模型的必备"养料",决定其通用能力[2] - 单个简单动作(如叠毛巾)需成千上万次重复训练才能形成标准化知识储备[2] - 行业核心痛点包括跨场景数据通用性不足、仿真与真实场景差距大、缺乏标准化数据格式与闭环迭代生态[2] 训练中心的战略定位与生态建设 - 中心定位为集研发、测试、培训、合作为一体的前沿基地,构建"数据-训练-验证-落地"全栈式服务能力[2][3] - 汇聚元客视界、艾欧智能等十余家产业链企业技术,形成覆盖感知、决策、执行的生态矩阵[3] - 联合鹏城实验室、上海人工智能实验室等机构搭建全闭环智能训练场,已服务海内外顶尖大模型及机器人企业[3] 商业化应用前景 - 规模化应用产生的真实数据(非仿真数据)是推动行业发展的关键,需先解决操作能力与成本问题[2] - 中心聚焦家庭服务(收纳、清洁)、农业(采摘)、工业(汽车装配)等场景的实操数据采集[1][2]