文章核心观点 - 基于大语言模型(LLM)的医疗AI系统在临床环境中的潜力日益增长,特别是在多次就诊的疾病管理方面展现出巨大潜力 [3] - 谷歌DeepMind和谷歌研究院开发的AMIE系统在疾病管理推理任务中的表现可与人类医生相当甚至更优,标志着AI从对话式诊断向复杂疾病管理推理的演进 [3][5][18] AMIE系统概述 - AMIE系统基于大语言模型,最初在对话式诊断任务中展现出与医生相当的表现水平 [5] - 为提升管理推理能力,研究团队开发了新型智能体系统,包含共情对话智能体和管理推理智能体,后者能交叉参考最新临床指南和药物目录 [5] - 系统利用谷歌Gemini大语言模型的长上下文能力,结合上下文检索与结构化推理,使其输出与最新的临床实践指南及药物处方集保持一致 [9] 疾病管理质量评估 - 在一项随机、盲法的虚拟客观结构化临床考试研究中,AMIE与21名初级保健医生在100个多访视病例场景中进行了比较 [10] - 在整体管理决策方面,AMIE的表现不劣于初级保健医生,而在治疗与检查的精确度、以及与临床指南的一致性和依据性方面,AMIE均得分更高 [10] 药物推理能力评估 - 为基准测试药物推理能力,研究团队开发了RxQA基准数据集,该数据集源自美国和英国的药物处方集,并经委员会认证的药剂师验证 [16] - 在“开卷”和“闭卷”情境下,AMIE和初级保健医生均受益于获取外部信息的能力,但在较高度的问题上,AMIE的表现优于初级保健医生 [16] 行业趋势与相关研究 - 研究展示了AMIE系统的演进轨迹:从最初的对话式诊断AI系统,逐步发展为能够处理多次就诊疾病管理的推理系统 [18] - 《自然》杂志同期发表的另一篇论文介绍了一个名为MIRA的自主AI智能体,它能在沙盒化的电子健康记录环境中运行,执行广泛的临床操作 [18] - 在真实患者病例模拟中,MIRA在诊断准确性方面优于人类医生,并做出了符合指南、用药安全且合理的住院决策,表明集成EHR的AI智能体可能成为医生更有效的决策支持伙伴 [18]
谷歌最新Nature论文:AI智能体医生,在疾病管理中胜过人类医生