Workflow
海天瑞声(688787) - 投资者关系活动记录表(2023年11月20日)
海天瑞声海天瑞声(SH:688787)2023-11-21 10:24

会议基本信息 - 会议时间为 2023 年 11 月 16 日和 17 日 [2] - 会议地点是海天瑞声会议室、腾讯会议 [2] - 参与单位有中信证券、广发基金等 [2] - 上市公司接待人员有证券事务代表张哲、投资者关系负责人袁璐 [2][3] 数据需求差异 - 大模型预训练数据与传统训练数据形态一致,但在规模、质量、来源等方面有差异,预训练数据 token 量普遍在万亿量级,传统模型约 10 亿量级,且来源更丰富 [3] - 大模型预训练数据更注重数据清洗工程化能力,对数据服务商要求更高 [4] - 强化学习标注与传统文本类标注单一标注形式趋同,但强化学习标注颗粒度更细、维度更广、学科更丰富、规模更大 [4] 数据需求趋势 - 随着大模型产品推出和迭代,未来大模型相关数据需求将持续显著增长,主要体现在预训练和强化学习阶段对多种数据的需求 [5] 公司数据生产效率提升 - 公司通过自研和 API 接入两种方式,探索将大模型接入一体化数据处理平台辅助数据生产 [6] - 自研方面针对大模型预训练数据集设计与处理技术研究规划,并开展相关数据获取与清洗工作 [6] - 已将部分开源或提供 API 接口的大模型接入平台,如在智能驾驶平台 DOTS - AD 中接入语义分割模型 SAM 并优化升级 [6][7] 智能驾驶数据业务 市场需求因素及趋势 - 市场需求与车厂车型及传感器丰富度、量产车数量、智能驾驶级别提升相关,三者影响相互叠加 [7] - 随着政策推出和单车成本下降,智能驾驶商业化进程加速,数据处理需求将呈指数级增长 [8] 核心竞争力 - 包括平台能力、算法能力和数据安全能力 [8] - 平台功能覆盖丰富度是评价平台水平核心要素,具备多种标注功能的供应商更具优势 [8] - 算法能力可提高平台生产效率、降低成本 [9] - 数据安全能力因智能驾驶数据涉及隐私信息,相关法规要求企业做好保障,无此能力的供应商将被淘汰 [9] 公司竞争优势 - 平台能力方面,年底将上线的第四代智能驾驶标注平台可支持全应用场景、各类型传感器及多传感器融合的数据处理,支持前沿标注需求 [9][10] - 算法能力方面,第四代平台将提升相关算法效果,提高数据标注效率、降低成本 [10] - 数据安全能力是竞争力重要构成因素,公司将抓住机遇铺开市场 [11] 公司与大数据交易所合作 - 公司在大数据交易所主要角色是数商,供应数据交易标的 [11] - 已与北数所、上数所、深数所等 3 家交易所建立联系,在北数所、上数所完成数据产品挂牌上市,成为北数所战略合作伙伴,未来将继续拓展合作 [12]