公司基本情况 - 证券代码 000710,证券简称贝瑞基因,2025 年 2 月 11 日下午 14:00 举行线上电话会议,接待人员有董事长高扬、智能数据部负责人李岳珍、董事会秘书许菲 [1][2] - 参与单位众多,包括国盛证券、信达澳亚基金等多家机构 [1] 行业与政策背景 - 2015 年起行业数据处理从算法时代进入智能化时代,目前基因检测行业智能化分析和 AI 大模型应用逐步进入实际应用阶段,如美国 Tempus 公司 [2] - 国内医疗行业发布大量规范性政策,样本出院受限,医院寻求本地化解决方案,国家相关部门发布指引和纲要,推动数字健康战略 [2] 公司业务基础与数据积累 - 长期从事基因测序行业,聚焦生育健康、遗传病检测、科技服务等领域,业务样本诊断数据海量,从几百 M 到几十 G [2] - 拥有 15 年基因检测基础,检测覆盖全生命周期,积累大量遗传相关人类基因组数据,为智能化算法等应用奠定数据基础 [3] - 基因检测数据中心数据存储量突破 PB 级,超亿条数据可用于内部科研等;公共和文献数据中心合计数据量超亿条;医疗知识图谱关系数量超数亿条,节点数接近亿级,数据均经精细化处理 [3] 智能化工具与平台 - 拥有多个自研算法和以开源大模型为基座的应用大模型,如遗传病预测算法、疾病解读大模型等 [4] - 拥有两大智能化平台,WESisi 平台助力医院搭建遗传病本地化综合管理,CNVisi 平台智能化解读报告系统助力临床高效解读 [4] - 为 2000 多家医院和科研机构提供咨询服务,涵盖所有临床基因检测产品 [4] AI 应用效果与规划 - 内部智能算法降本增效,解读人员报告解读效率从每天个位数提升到几十份,提高临床报告产出能力,利于复杂基因检测产品推广 [5] - 大模型增加检测分析能力,消除不同临床机构理解误差,提高基因检测服务质量;提高研发团队研发效率,可定制化开发检测产品 [5] - 为 B 端打造 AI 诊断、慢病管理、医疗服务等智能 Agent;为 C 端推出适合平台,为围产期家庭提供家庭医生服务 [5] - 接入 Deepseek、千问等多种开源模型,与多家大型医疗机构达成战略规划,开展 AI 智能大数据建设,预计年内落地 [6] 数据层面建设 - 构建自动获取信息的离线数仓,进行完整数仓规划,建立数据标准和指标,采取空间隔离和数据落盘加密措施确保数据安全 [8] - 医疗数据湖包括公共数据中心,整合数据关系和节点形成公共数据知识图谱;文献数据中心,收录超 3500 篇 NCBI 标题和摘要等数据,自研算法进行结构化开发;基因检测数据中心,基于千万临床数据进行群体化开发,设计实时信息更新提醒机制 [8][9][10] 智能化算法成果 - 外显子检测初期开发 berrylyzer 智能算法,2020 年投入临床样本检测,准确率达 99%以上,WES 检测一分钟内完成分析,WGS 检测十分钟内完成分析,不依赖 GPU,内置于 WESisi 软件 [10] - CNVisi 智能化解读报告系统实现“端到端”输出,降低报告解读门槛,内置 20 + 权威公共数据库及百万中国人 CNV 内部数据,解读结果与“金标准”二分类一致率达 95%以上 [10] - 开发医学实体抽取归一化算法等智能化小工具,以及帮助医生和患者理解报告和疾病的大模型及对话小助手 [11] 问答环节要点 数据梳理 - 建立统一数据标准,推进数据整合,解决数据标准不统一问题 [12] - 通过模型带动开发梳理海量数据,确保准确性、完整性和一致性 [12] - 采用大数据架构处理数据,提升数据可解释性、处理效率和质量 [13][14] - 对私有数据脱敏处理,构建数据开发框架,解决数据出院问题,提供个性化服务 [14] 大模型发展与应用场景 - 布局专业领域疾病解读大型模型和升级遗传咨询大模型为健康管理大模型两大板块,为医生和用户提供全面医疗服务 [15] 大模型接入影响 - 已使用 llama、qwen、GLM 等开源基座大模型,进行与 deepsee 系列模型平行测试 [16] - deepseekR1 蒸馏方案为专业化疾病解读等模型开发、落地带来希望,可在有限资源和数据集下进行临床转化和产品升级 [17]
贝瑞基因(000710) - 000710贝瑞基因投资者关系管理信息20250211