多位三甲医院主任谈AI诊断:缺乏判断的人类拖了后腿?
中国经营报·2026-01-07 01:13

AI在医疗诊断中的应用现状与核心挑战 - 多位来自北京三甲医院的专科主任指出,在医疗诊断场景中,AI结论是否可靠的关键不在于使用哪个模型,而在于能否问对问题以及能否抓住症状背后的核心线索[1] - 若患者本身无法分辨疾病的深层原因,AI输出的结果往往难以直接作为诊疗依据[1] - 当被问及哪些大模型在医疗诊断中相对靠谱时,多位三甲医院主任一致认为,与其纠结模型排名,不如先解决怎么问的问题[1] AI诊断的局限性:提问艺术与深度理解的缺失 - 北京协和医院神经内科主任医师朱以诚教授指出,AI诊断的靠谱与否本质上是提问的艺术,用户甚至可以通过调整问题让模型给出自己想要的回答[2] - 病人自己描述病情时往往抓不住重点,例如只说头疼而实际核心症状可能是发烧,医生的价值在于通过追问和引导提炼关键信息,这是病例诊断的核心[2] - 同样的模型,不同的人去问,结果可能完全不同,这在病例比赛中也常遇到[2] - 在多位医生看来,AI缺乏的不是数据,而是对症状的深度理解[2] - 首都医科大学宣武医院神经肌肉病专科主任笪宇威补充,AI诊断的靠谱性从来不是模型好不好的问题,而是有没有问对问题[2] - 例如病人说双下肢无力,AI可能直接判定为肌力下降,但医生会进一步分辨这可能是肌张力变化或共济失调导致的步态异常[2] - AI缺乏对症状的深度解读能力,这是它很难替代医生的原因,尤其在神经科这类高度依赖临床经验的领域[2] - 多位受访医生强调,现阶段AI给出的结论仍不能盲目信任[2] AI在中医辨证论治中的局限与辅助作用 - 首都医科大学附属北京中医医院消化中心主任张声生分析,对于人工智能助手如ChatGPT或豆包等,其结论往往依赖输入信息的背景,背景信息不同可能导致迥异的结论[3] - 不能简单地说哪个模型更好或更不靠谱,人工智能在提供科普知识方面可能有一定帮助,但完全依赖它来治病显然不可行[3] - 从中医视角看,AI在精准辨证上的局限更为突出[3] - 首都医科大学附属北京中医医院消化中心副主任赵鲁卿教授补充,中医讲究辨证论治,很多证候如脾胃湿热、肝郁脾虚,病人本身就很难精准描述,更难转化为可供模型准确识别的输入[3] - 因此很少有病人拿着AI结果来找中医,不过就个人日常文字工作所需而言,DeepSeek相对靠谱[3] - 多位医生普遍认为,医生的价值在于能从患者混乱、碎片化的主诉中提炼核心症状,识别真正的诊断线索,并通过专业追问与临床经验完成判断与排除,这正是AI目前难以学会的部分[3]