Workflow
多语种和多情感TTS数据
icon
搜索文档
海天瑞声20250901
2025-09-02 08:42
海天瑞声电话会议纪要关键要点 纪要涉及的行业或公司 * 海天瑞声 一家专注于AI数据服务的上市公司 业务涵盖语音 文本 视觉数据标注与处理 以及海外内容审核 具身智能数据等新兴领域[1][2] * 行业涉及人工智能 大模型训练 数据服务 数字人 具身智能 以及政府主导的数据要素产业化[2][9][10][12][14][15][16] 核心观点和论据 **业务增长驱动因素** * 2025年上半年收入达1.57亿元 同比增长69.54% 三大增长引擎为国央企AI转型 国内外科技企业出海 海外内容审核业务拓展[4] * 国央企AI研发投入驱动境内业务增长 中国移动作为代表 海天瑞声为其体系内唯一被投数据服务企业 2024年大份额订单在2025年上半年确认收入[5] * 传统科技互联网大厂仍是重要客户 阿里巴巴全球化推广需求激增 贡献收入为去年同期五倍多 语种从29种增至119种 多情感多音色TTS数据采购大幅增加[6][7] * 海外内容审核业务成为新增长点 通过菲律宾基地为两家跨国互联网公司服务 规模1500人 年收入数千万元 现金流稳定 客户粘性强 并拓展美国定制数据标注业务[8] **毛利率与收入结构变化** * 2025年上半年毛利率下滑因定制服务占比增加 标准化产品占比下降 1.6亿收入中1亿来自定制服务 6000万来自标准化产品[3][18] * 收入结构变化 语音收入占比从70%降至44% 视觉收入占比从20%升至40% 文本占比15%-16% 因视觉业务毛利率较低(20%-30%) 语音较高(40%-50%) 文本居中(约30%)[21] * 公司主动摒弃低毛利大单(如抖音3亿级别) 转向中高阶项目 如为快手可灵提供高质量美学鉴赏数据集 快手成为第二大客户[18] **新业务布局与市场预期** * 数据市场加速扩张 高质量数据成关键 多模态方向如语音和视觉存在巨大缺口 语音需训练语种 音色 情感 场景等维度 视觉需高质量视频文本对数据(如快手每年需数千万堆图像或视频文本堆)[9] * 行业模型面临数据短缺(如医疗影像 银行信贷记录等私域数据) 需政府统筹协调 海天与多地政府及国资公司深度合作 具卡位优势[10] * 与地方政府合作聚焦行业高质量数据集建设 以文旅数据为切入点 与成都彭州国资合资成立公司 开发上百小时精品视频及10万组视频问答对 用于数字人导游 AI生成营销内容及AR体验[10] * 参与北京门头沟数字人项目 提供2000个数字人形象[11] * 与地方政府合作三方面 数据处理平台建设(单个城市或项目规模千万量级) 持续数据处理服务 标准人才培养 已与成都 长沙 保定成立合资公司 推进上海 广州等十多个城市合作[12] **全球合作与具身智能** * 积极参与全球人工智能合作 在广西建立中国东盟人工智能创新合作中心 承接东盟语种语料库建设 订单规模约2000万 支撑本地大模型开发[13] * 高度重视具身智能 与瑞曼战略合作 共建人形机器人数据训练中心 探索四种数据获取路径 遥操员真实采集(质量最高成本最高) 动作捕捉 合成数据 互联网爬取(效果最差)[14][16][17] * 具身数据要素产业化项目已落地六个省份的六个城市 与地方政府合作推进 如内蒙古加入具身训练场方案[17] **未来展望与增长持续性** * 业务高速增长来自国内外科技大厂AI应用落地进展 如美国知名手机厂商(海外重要客户) Zoom(上半年贡献超千万收入 含医疗场景数据采集与标注)[19] * 国内市场增量空间大 国务院AI加实施方案目标2027年agent普及率70% 央企如中国移动从2024年四季度行动 与联通 电信 中电子 中电科等合作 开放场景与原始数据 配备充足预算[20] * 各地数据要素产业化项目推进 第一批在6个城市设7个子公司 后续十几个城市洽谈中[20] * 下半年及明年重点发力境外市场(空间更大竞争较小) 美国科技巨头前七个月中高阶精品数据预算约50亿美元 国内仅10亿人民币 相差35倍 全年增速预计至少50%以上 有望延续到明年[22] 其他重要内容 * 经营现金流承压因定制化收入增长带来支出增加 及管理层奖金上半年集中发放 未来通过优化成本控制和合理安排奖金发放改善[21] * 境外销售收入已占公司总收入一半[17] * 目标实现合理净利润率 难以回到上市初期40%水平[18]