顶级专家谈医疗AI价值:如果AI创造了100块钱价值,请把98块还给病人
雷峰网·2026-03-06 11:46

文章核心观点 文章通过一场圆桌论坛,探讨了医学大模型从技术演示到规模化应用的发展路径,核心观点认为:医疗大模型的价值在于创造低成本、高质量的医疗生产力,其成功的关键不在于算法架构,而在于高质量的数据治理、专业的医学对齐以及严格的伦理边界设定,最终目标是构建以患者为中心的数字健康生态 [4][7][9][15][16] 行业发展趋势与核心挑战 - 行业正从通用大模型的“算力竞赛”转向垂直领域的“知识深度竞赛”,在极度细分的医疗领域,掌握专家反馈闭环和专业知识对齐的小团队有能力超越通用模型 [10][32] - 医疗大模型普及的最大障碍之一是全球差异化的监管环境,美国与欧洲的监管更为严苛和保守,而国内监管相对友好,公众接受度较高 [49] - 行业面临“数字鸿沟”挑战,在海外,边远地区老年人对AI接受度低,而在国内,三四线城市及中老年用户因医疗资源匮乏反而成为医疗AI的重要用户群体 [50][51] 医疗大模型的价值定位与评估标准 - 在严肃医疗领域,AI技术价值的终极标准是能否“进入临床诊疗指南”,这是其在严肃医疗中获得合法执业地位的前提 [7][50] - 医疗AI的核心角色是填补“以患者为中心”的服务缺口,例如作为患者的“第二诊室”或“数字管家”,通过预问诊、随访和长程记忆,弥补医生面诊时间短、服务断裂的不足 [9][25][48] - 评估医疗AI应遵循“以病人为中心”的原则,在费用和社会消耗可控的前提下,衡量病人是否获得最大收益,其价值分配的理想状态是:若AI创造100元价值,应让病人拿走98元,开发者分2元 [7][55] 技术壁垒与核心竞争力 - 医学大模型真正的护城河不在于Transformer等算法架构,而在于“冰山之下的评测集与数据治理(Data Curation)”,处理非规范、残缺的“脏”临床数据是主要难点 [9][54] - 构建高质量的医疗评测基准(Benchmark)成本极高,生成一条复杂的高质量评测数据在国内成本约三四千元人民币,需要与顶尖医生合作定义“北极星指标” [9][54] - 数据治理AI的算法复杂度可能超过最终训练模型的算法,研发者80%的精力应放在将医院数据转化为“AI Ready”的高质量临床养料上 [55] 产品实践与市场表现(以蚂蚁集团“阿福”为例) - 蚂蚁医疗大模型“阿福”APP下载量已突破5000万,日活用户达到1000万,每天回答的提问数超过1000万,月环比增速达94% [18][21][35] - 用户结构均衡,60后、70后、80后占比极高,55%的用户来自三线以下城市,反映了中老年群体及医疗资源欠发达地区的强需求 [21] - 核心功能包括健康档案记录与管理、多模态健康问答(支持拍皮肤、化验单、药盒)、以及链接“好大夫”线上30万名三甲医生资源等服务 [22] 风险控制与伦理对齐 - 需警惕大模型的“AI迎合性”或“AI精神错乱(AI Psychosis)”风险,即模型为获得好评而顺着用户错误认知说话,可能强化患者幻觉,诱导极端行为 [12][41][42] - 医疗AI必须具备“场景敏感度”,在儿科、心理科需提供温情与安抚,但在涉及重症决策时必须切换到“冷峻模式”,学会在证据不足时“拒绝回答”或“建议去医院”比学会回答更重要 [12][13][47] - 通过分层“医学对齐”控制风险,包括表达层、理解层和安全层,并需在产品端设置“红色警报”机制,在识别到严重风险时接入真人专家干预 [44][45][47] 未来应用场景与发展阶段 - 短期核心应用场景是“预问诊”与“随访”Agent,可提升医生诊断效率,一个医生团队能因此管理更多患者,目前挑战在于与医院HIS系统深度对接 [52][53] - 未来演进分为三阶段:第一阶段提升知识深度与医学感知能力;第二阶段各种专业Agent(营养、康复等)爆发;第三阶段实现人机协同新范式,一个主任医师通过AI辅助可能管理上万个患者 [56] - 理想形态是“每个家庭都有一个AI健康管家”,作为拥有长程视角的“数据守望者”,存储用户完整健康档案,提供全局健康管理 [7][54]