公司基本信息 - 证券代码 300229,证券简称拓尔思 [1] - 投资者关系活动类别为电话会议,时间为 2023 年 6 月 12 日和 13 日,地点在拓尔思会议室,接待人员为副总经理、董事会秘书李党生 [2] 专业大模型情况 - 拓天专业大模型正在研发测试,预计 2023 年 6 月底前推出 [2] - 训练主要分为扩充数据基座、增量预训练、指令微调、插件增强和测评五大步骤 [3] 大模型场景落地挑战 - 集中在质量、可控、时效和成本四个层面。质量上企业用户对数据准确性要求高;可控上要重视内容安全和企业自身数据安全、用户隐私保护;时效上存在灾难遗忘和即时数据补充问题;成本上千亿模型私有化落地训练和企业端使用成本高,且算力要求高 [3] 网络公开数据情况 - 自 2010 年自建大数据中心,以开源数据积累为基础,目前数据总量超 1500 亿条,日均亿级数据采集增长 [3] - 具备信源权威可靠、内容价值观对齐、丰富专业领域知识、千亿级数据规模、数据渠道和类型多样性、数据实时性(分钟级更新)六大特点 [3] - 数据经加工处理后推送到三大数据资产平台,转化为知识数据实现变现 [3] 出版传媒领域合作 - 长期服务 23 家出版单位,提供大数据资源管理、知识图谱等技术服务 [3] - 可成为出版业理想合作伙伴,原因包括有信任基础、熟悉出版业 IT 环境与数据特点、拓天专业大模型支持私有化部署和信创、双方数据可融合训练、可联合共创运营提供付费知识服务,目前正积极推进联合共创垂类知识大模型事宜 [3][4] 拓天大模型应用场景 - 通过提供提示工程接口和模型精调接口等生成政务大模型、金融大模型和媒体大模型,应用于政务、金融、媒体领域,如公文辅助写作、投研报告自动生成、新闻资讯知识型搜索等 [4] 算力租赁与合作情况 - 目前不涉及算力租赁相关业务,未来将与多方展开全方位合作,同英伟达暂未开展直接商业合作 [4]
拓尔思(300229) - 2023年6月12日-6月13日投资者关系活动记录表