Workflow
有了赛博医生,就不用怕过度诊疗?
虎嗅·2025-06-03 09:03

医疗AI偏见问题 - 大模型在医疗诊断中表现出基于收入水平的偏见 高收入人群更可能获得CT和核磁检查机会 中低收入病例通常只进行基本检查或不检查[1] - 住房状况影响诊疗决策 无住房患者更频繁被指向紧急护理 侵入性干预或心理健康评估[2] - 研究覆盖9个自然语言大模型 评估1000个急诊病例(500真实+500合成)的170万个看诊结果[2] 数据质量缺陷 - 医疗数据存在代表性不足问题 经济收入较低人群就诊频率低导致数据缺失 儿童孕妇等特殊人群药物研究数据不足[6] - 数据标注质量存在偏差 标注时带有个人偏见和主观判断 数据标注标准不统一[6] - 医疗活动本身存在无意识偏见 女性患者疼痛评分概率比男性低10% 女性心梗患者误诊几率高出男性50%[7][8] 技术局限性 - AI仅凭X射线就能预测患者种族性别信息 比人类医生更精于"看人下菜碟"[2] - 临床医生使用有系统偏见的AI模型时 诊疗准确性显著下降11.3%[4] - 生成式人工智能本质是概率模型 小概率损害事件难以避免 对容错率趋近零的医疗行业构成挑战[12] 人机对齐解决方案 - 通过RAG检索增强生成和RLHF基于人工反馈的强化学习等技术 在大模型中注入人类价值观[11] - 训练阶段增加数据过滤环节 加入指令微调让模型理解人类语言 利用奖励函数引导符合价值观的回答[11] - OpenAI超级对齐团队原计划消耗20%算力解决对齐问题 但项目最终解散[12] 医疗体系升级需求 - 精准医疗与过度医疗存在灰色地带 需要足够多数据来清晰界定边界[14][15] - 功能医学需要检测200多项指标来绘制健康地图 强调从以疾病为中心向以病人整体为中心转变[16] - 患者跨机构交叉验证诊断方案可使过度医疗降幅达40% 可穿戴设备和AI技术正在压缩过度诊疗空间[17] 医学发展现状 - 中国女性肺癌患者过度诊疗率从2011-2015年22%增长至2016-2020年50% 女性肺腺癌患者近90%属过度诊断[8] - 西医分科制度存在局限性 如皮肤科与消化科缺乏交集导致湿疹病因难以识别[16] - 许多生理性改变如7mm以下肺结节 甲状腺结节 窦性心律等并不需要过度关注或治疗[17]