Workflow
AI Healthcare
icon
搜索文档
AI健康应用爆发 大模型“看病”是否靠谱?我们进行了实测
新京报· 2026-01-23 21:08
行业动态:AI健康赛道进入密集爆发期 - 岁末年初,AI健康赛道进入密集爆发期,多家大厂和独角兽企业密集发布或升级产品 [1] - 标志性事件包括:蚂蚁集团升级发布“蚂蚁阿福”并一度冲入苹果应用商店排行榜前二,百度升级发布文心健康管家,OpenAI推出ChatGPT Health功能,京东健康发布“知医”,百川智能发布新一代开源医疗增强大语言模型Baichuan-M3 [1] - 随着“大厂”纷纷下场,面向消费者(C端)的健康大模型应用竞争变得更加激烈 [10] 产品功能与商业模式 - 主流健康大模型应用(如小荷AI医生、夸克健康、平安好医生、讯飞晓医、百度文心健康、京东健康、蚂蚁阿福)均具备拍照识别解读报告、拍药盒、拍患处、AI问诊等基本功能 [2] - 产品形态多样:蚂蚁阿福、小荷AI医生、讯飞晓医推出了独立App;夸克、百度将AI健康模块嵌入搜索引擎App;平安好医生、京东健康则在原App中增加AI功能 [10] - 垂直类健康大模型正成为“引流”入口,功能不再局限于单一属性,部分应用表现出向“超级应用”发展的趋势 [10][11] - 例如,蚂蚁阿福和小荷AI医生的“拍药品”功能可分别跳转至淘宝闪购和抖音平台便捷买药,蚂蚁阿福寻医问药时还可授权使用支付宝查询医保 [11] - 部分应用(如蚂蚁阿福、百度健康、平安好医生)已推出医生线上问诊功能,用户付费后可进行图文、语音或视频问诊 [8] - 蚂蚁阿福的“AI找医生”接入了互联网医疗平台“好大夫在线”,通过大模型分析用户需求并提供针对性医生推荐 [8] 技术表现与用户反馈 - 在对同一份甲状腺体检报告(TSH指标偏高)的解读测试中,7款应用均表现出“谨慎”态度,使用了“可能”、“提示”、“倾向于”等词汇 [2][3] - 在症状诊断上,各应用结论基本一致,均指向“亚临床甲状腺功能减退”或类似状态 [3] - 在就医建议上存在分歧:夸克健康、讯飞晓医、蚂蚁阿福明确建议用户前往医院就诊;其他应用则建议定期复查或出现症状后再就医 [4] - 部分应用具备增强用户互动与留存的特色功能:小荷AI医生和百度文心健康会追问用户是否存在相关症状;京东健康会给出相关的医生问答内容;小荷AI医生的语言风格明显更为口语化 [4][5] - 大模型“幻觉”问题仍然存在:有个别应用在解读中将TSH(促甲状腺激素)错误识别为HCG(人绒毛膜促性腺激素),甚至建议用户“优先排查是否怀孕” [1][5] - 医疗垂类模型的技术人员表示,幻觉是大模型的通病,难以百分百消除,只能尽量减少 [5] - 用户反馈褒贬不一:有用户认为AI健康应用是“随时随地都在、有医学知识的小助手”,能缓解焦虑,但不会完全采纳其建议;也有用户直言要“避大雷” [7][8] - 有健康应用用户总结出平衡使用不同大模型的方法论,例如同时咨询多个应用以交叉验证 [7] 监管与行业规范 - 监管层已关注到AI医疗热潮并陆续发声,为行业设定“交通规则”和“安全护栏” [1] - 北京市发布“AI+医疗健康”新政,强调需秉持包容审慎原则,遵循伦理规范,保障患者信息安全与生命健康安全,禁止用AI完全替代医务人员的专业判断 [6] - 已有公立医院官方账号提醒患者切勿因过分依赖AI问诊而错过就诊黄金窗口期 [6] 潜在风险与行业认知 - 医生处方与AI建议冲突的案例已引发关注,例如有AI建议谨慎使用医生开具的儿童药物,称其临床数据有限 [6] - 有案例显示,家长依赖AI问诊平台判断孩子病情为普通呼吸道感染并居家用药,导致病情延误近一个月,最终发展为肺炎 [6] - 行业专业人士(如住院医师)认为,患者向AI咨询健康问题“有用”,但“肯定不能算是看病”,只能当作了解病情、辅助决策的工具 [7] - 互联网健康并非新概念,京东健康、平安好医生、百度健康等是老玩家,在AI时代接入大模型是自然动作 [10]