Workflow
金域医学20250212
金域医学金域医学(SH:603882)2025-02-13 18:51

纪要涉及的公司 金域医学[1] 纪要提到的核心观点和论据 - AI领域布局与发展历程:2014年起探索AI,用小金算模型进行病理诊断AI研究;2023年组建大模型项目团队;2024年发布大模型“预见一言”,上线智能应用“小御医”,实现医学检验服务全场景智能化,应用涵盖多场景,还接入DSAK [3][4] - 数据资产推动AI产品发展:拥有大量高质量数据资产,2014年与科研机构合作开展AI产品探索,2018年推出宫颈癌筛查类诊断AI产品,验证结果全球领先,得益于积累的病例数据库 [5] - 人工智能开放创新平台进展:2019年获广东省科技厅授予的“病例、医学检测与病理诊断人工智能开放创新平台”牌照,基于此平台累积数据资源,扩大生态伙伴,持续探索人工智能 [6] - 大模型技术应用:2023年底ChatGPT推出后迅速组建大模型团队,选择开源框架开发行业大模型,2024年上线,聚焦多场景赋能,是首个获中央网信办备案的第三方意见行业模型 [7] - 大规模语言模型接入DeepSeek效果:完成技术验证对比,本地部署并与云厂商合作在云端满血运行,接入后在强推理场景表现出色,提升整体能力,“小御医”已接入并对内部员工开放,计划向52万注册医生开放 [8] - 评判模型能力提升标准:春节前开始对DB进行功能设施和场景测试验证,模型在逻辑架构清晰度、推理过程可解释性等方面有显著提升,尤其在复杂场景,但存在信息不完整或部分幻觉问题 [10] - 疾病研究领域:研究公司八大疾病线,白血病(血液病)是强项,在感染疾病线、免疫等领域也有较强实力,并逐步跟进其他疾病线 [11] - 高质量数据界定及合规保障:数据总量达24P,每年增量1P,覆盖中国90%人口区域,服务23000家医院,涵盖4000多个检测项目,经严格标准化、结构化处理和二十多年数据治理;严格遵守国家规定,通过第三方机构认证并完成首单海量数据交易 [12] - 数据连续性及多模态分析重要性:数据连续性、结构化和标准化对高质量数据至关重要,多模态分析结合多种数据类型,有助于提高疾病诊断准确度与可靠性 [13] - 保证数据完整度措施:通过疾病联盟等业务推进模式保证数据完整度,支持数百个疾病联盟,包括十几个国家级联盟,提供线上服务平台汇聚数据,用于科研队列研究和大模型训练 [14][15] - 数据使用范围:数据不公开,仅针对联盟内医生和金域使用,联盟内合作有协议限定 [16] - 与其他医疗软件提供商数据处理区别:金域是医疗机构,数据在检测服务过程中产生,可将其加工成数据资产,与其他仅作为代理商或平台的数据处理方式有本质区别 [17] - 大模型训练数据量需求:大模型训练所需数据量与具体任务和定位有关,垂直领域大模型需大量且丰富多样的数据形成竞争壁垒 [18][19] - 医疗领域数据量和语料积累影响:医疗领域数据量和语料积累至关重要,基础门槛至少需几十个PB数据量,每个疾病线和亚型都需储备大量数据 [20] - 商业变现路径:一是通过技术应用提升实验室效率降低成本;二是提供面向医生管理的政策服务,推广医共体智能体应用;三是直接变现,包括医院内部部署信息化服务、参加招投标等,“Deepseek”集成后推出基础版和高级版收费 [21] - 医院信息化解决方案及定价:与AI大模型相关可能软硬一体,一般数字化系统以软件为主,定价考虑成本和市场比价,专注有自身特色的系统应用,有竞争价格空间和定价灵活性 [22] - 第三方数据场内交易细节:与国药集团旗下子公司完成交易,基于数据分析报告用于指导药品流通等,走通合规数据交易路径,展示数据产品可满足B端客户个性化需求 [23] - Deepseek R1对行业影响:DBC作为第二代语言模型,与第一代指令型模型相比有显著改进,能理解用户意图,提供更精准解决方案,提高AI应用下限水平 [24] - 避免医疗领域知识幻觉方法:在现有模型基础上进行知识外挂和微调提升,加强专业问题思维链条的数据整理,挂载关键医学协作知识 [25] - 基因测序领域发展方向:降低检测成本,增强检测结果与临床疾病诊断指导性的相关性,大模型可提升报告解读能力,分析基因变异与疾病关系,开发早期筛查产品 [26] - 开发优质早筛产品可能性:通过深入研究基因变异与疾病关系,有可能开发出优质早筛产品,国外已有类似产品通过大模型分析实现数字化诊断标准 [27] - 诊断领域大单品出现可能性:随着技术进步和大数据应用发展,诊断领域会出现改变现有格局的超大单品 [28] 其他重要但是可能被忽略的内容 - “小御医”自2024年初上线以来,每月访问量不超过10万次 [9]