分组1:公司收入增长原因 - 大模型技术发展和应用领域拓展,带动全球科技公司对人工智能研发投入复苏增长,多语言智能语音、文本等数据需求增加,拉动公司营业收入同比大幅提升 [3] 分组2:版权数据方面的价值 - 汇聚不同版权方数据,针对客户需求提供不同版权数据 [3] - 针对客户定制化需求,对版权数据进行精细化清洗,节约大模型训练算力,使其具备良好法律道德价值观 [3][4] 分组3:数据方面的核心竞争力 - 技术平台能力:重视技术研发,加大投入,提升算法、平台、工程化能力,加深算法辅助与人工结合,提高人机协同效率,做大规模、提升效率、降低成本 [4] - 业务模式:服务产品双模式,产品化贡献显著,标准化数据集研产销体系复用性为规模化和高利润率提供保障;截至2023年12月末,积累超1550个自有知识产权训练数据标准化产品,数据库存量居全球企业前列 [4][5] - 供应链资源管理能力:通过长期建设的供应链体系保障资源获取,未来加大供应链资源平台建设,提升各方面能力,支撑客群拓展 [5] - 数据安全及合规能力:形成成熟安全、合规管理体系,通过重要体系认证,拥有相关资质,符合国际通用与国内法律法规要求,获业务领域合作客户高度认可 [5][6] 分组4:自动化标注及相关技术影响 - 自动化标注是行业发展趋势和企业核心竞争力之一,核心是提高人机协作效率,公司持续加大研发投入,提升数据生产智能化水平 [6] - 合成数据是人工智能行业发展到一定阶段的产物,可作为数据采集辅助方式,但有局限性,无法替代真实场景数据,公司会关注其发展并调整业务布局 [7] 分组5:大模型发展对公司业务的影响 - 大模型向多模态发展会产生更多新型数据需求,推动数据服务行业进入更大增量空间 [8] 分组6:接入大模型提升数据生产效率 - 公司通过自行研发和API接入两种方式,探索将大模型接入一体化数据处理平台,提高人机协作效率,辅助数据生产 [9] - 自研大模型方面,开展预训练数据集设计与处理技术研究规划,进行相关数据获取与清洗工作,开展评测技术调研并完成基础框架设计 [9] - 接入部分开源或提供API接口的大模型,如在智能驾驶平台接入开源语义分割模型并优化升级,提升2D语义分割项目降本增效能力 [9][10]
海天瑞声(688787) - 投资者关系活动记录表-(2024年5月20日)