谷歌最新Nature论文：AI智能体医生，在疾病管理中胜过人类医生

文章核心观点 - 基于大语言模型（LLM）的医疗AI系统在临床环境中的潜力日益增长，特别是在多次就诊的疾病管理方面展现出巨大潜力 [3] - 谷歌DeepMind和谷歌研究院开发的AMIE系统在疾病管理推理任务中的表现可与人类医生相当甚至更优，标志着AI从对话式诊断向复杂疾病管理推理的演进 [3][5][18] AMIE系统概述 - AMIE系统基于大语言模型，最初在对话式诊断任务中展现出与医生相当的表现水平 [5] - 为提升管理推理能力，研究团队开发了新型智能体系统，包含共情对话智能体和管理推理智能体，后者能交叉参考最新临床指南和药物目录 [5] - 系统利用谷歌Gemini大语言模型的长上下文能力，结合上下文检索与结构化推理，使其输出与最新的临床实践指南及药物处方集保持一致 [9] 疾病管理质量评估 - 在一项随机、盲法的虚拟客观结构化临床考试研究中，AMIE与21名初级保健医生在100个多访视病例场景中进行了比较 [10] - 在整体管理决策方面，AMIE的表现不劣于初级保健医生，而在治疗与检查的精确度、以及与临床指南的一致性和依据性方面，AMIE均得分更高 [10] 药物推理能力评估 - 为基准测试药物推理能力，研究团队开发了RxQA基准数据集，该数据集源自美国和英国的药物处方集，并经委员会认证的药剂师验证 [16] - 在“开卷”和“闭卷”情境下，AMIE和初级保健医生均受益于获取外部信息的能力，但在较高度的问题上，AMIE的表现优于初级保健医生 [16] 行业趋势与相关研究 - 研究展示了AMIE系统的演进轨迹：从最初的对话式诊断AI系统，逐步发展为能够处理多次就诊疾病管理的推理系统 [18] - 《自然》杂志同期发表的另一篇论文介绍了一个名为MIRA的自主AI智能体，它能在沙盒化的电子健康记录环境中运行，执行广泛的临床操作 [18] - 在真实患者病例模拟中，MIRA在诊断准确性方面优于人类医生，并做出了符合指南、用药安全且合理的住院决策，表明集成EHR的AI智能体可能成为医生更有效的决策支持伙伴 [18]