Workflow
健康大模型
icon
搜索文档
AI健康应用爆发,大模型“看病”是否靠谱?我们进行了实测
贝壳财经· 2026-01-23 20:29
行业动态与竞争格局 - 自2024年12月中旬起,主要科技公司与独角兽企业密集发布或升级AI健康应用,包括蚂蚁集团的“蚂蚁阿福”、百度的“文心健康管家”、OpenAI的“ChatGPT Health”、京东健康的“知医”以及百川智能的Baichuan-M3,掀起AI医疗热潮[1] - 市场竞争激烈,蚂蚁阿福、小荷AI医生、讯飞晓医已推出独立App,表现出更明显的垂直性特征;夸克、百度将AI健康模块嵌入搜索引擎App;平安好医生、京东健康则在原有App中增加AI功能[18] - 蚂蚁阿福表现突出,其前身是2025年6月推出的AQ,半年后升级并更名为阿福,定位从“AI工具”转向“AI健康朋友”,旨在提高使用频率和用户留存[19][20] - 行业竞争目标逐渐清晰,核心在于打造“Super App(超级应用)”,其特征是“All in One”的功能设计,通过一个入口实现从信息获取到问题解决的闭环[23] - 垂直赛道大模型有机会成为超级应用,但成功与否取决于其对目标用户的留存程度[24] 产品功能与用户体验 - 测试的7款主流健康大模型(小荷AI医生、夸克健康、平安好医生、讯飞晓医、百度文心健康、京东健康、蚂蚁阿福)均具备拍照识别解读报告、拍药盒、拍患处、AI问诊等基本功能[3] - 在解读一份甲状腺体检报告时,7款应用均识别出TSH(促甲状腺激素)指标偏高,并一致倾向于诊断为“亚临床甲状腺功能减退”或类似状态,诊断措辞普遍谨慎,使用“可能”、“提示”、“倾向于”等词汇[4][5] - 在就医建议上存在分歧:夸克健康、讯飞晓医、蚂蚁阿福明确建议用户前往医院就诊;其他应用则建议定期复查或出现相关症状及时就医[6] - 部分应用在交互上做出差异化:小荷AI医生、百度文心健康在问答结束后会追问用户症状;京东健康提供相关的医生问答;小荷AI医生的语言风格更为口语化[7] - 用户反馈显示,AI健康应用的角色更类似于“助手”或“有医学知识的小助手”,用于缓解焦虑、辅助决策,而非替代医生[13][14][15] - 部分应用已整合线上问诊功能,如蚂蚁阿福、百度健康、平安好医生,用户支付费用后可进行图文、语音或视频问诊[16] 技术表现与现存问题 - 大模型在解读体检报告时存在“幻觉”问题:有个别应用将TSH指标错误解读为HCG(人绒毛膜促性腺激素),甚至建议用户“优先排查是否怀孕”,同一错误在测试中出现了两次[1][8] - 技术人员指出,幻觉是大模型的通病,垂类模型也难以百分百消除,只能尽量减少[9] - 百度文心健康在指标分析上表现更深入,其不仅关注异常指标TSH,还提示另一项正常范围指标T3可能因TSH升高而偏低[5] 商业模式与生态整合 - 垂直类健康大模型已成为“引流”入口,功能不局限于单一属性[21] - 部分应用展现出与母公司生态打通的趋势:蚂蚁阿福的“拍药品”功能可跳转至淘宝闪购,寻医问药时可授权使用支付宝查询医保;小荷AI医生的同类功能可跳转至抖音平台购药[22] - 行业对商业化变现持谨慎态度,蚂蚁阿福公开声称其健康问答内容无广告推荐、无商业排名,不受商业因素干扰[23] 监管环境与行业警示 - 监管层已关注AI医疗热潮并陆续发声,北京市在2025年12月30日发布“AI+医疗健康”新政,为行业划出明确边界;国家网信办于2026年1月7日发布《人工智能拟人化互动服务管理暂行办法(征求意见稿)》,设定发展规则[2] - 监管政策强调需秉持包容审慎原则,遵循伦理规范,保障患者信息安全与生命健康安全,禁止用AI完全替代医务人员的专业判断[10] - 已出现医生处方与AI建议冲突的案例,例如有AI建议谨慎使用医生开具的儿童雾化药物[11] - 有公立医院发布案例警示,因患者过分依赖AI问诊,导致患儿病情延误近一个月,从普通呼吸道感染发展为肺炎[11] - 行业专家与医生观点认为,AI咨询健康问题“有用”,但只能当作了解病情、辅助决策的工具,不能算是看病[13]
夸克通过“主任医师级”笔试
第一财经· 2025-07-23 21:32
行业动态 - 全球AI医疗健康市场规模预计从2021年110亿美元增长至2028年1940亿美元 年复合增长率超过41% [1] - 字节 百度 阿里等大厂均在押注健康大模型赛道 [1] - 行业现阶段核心痛点为健康大模型准确性不足 模型能力被视为基础竞争力 [1] 技术突破 - 夸克健康大模型通过中国12门核心学科主任医师笔试评测 成为国内首个完成该挑战的大模型 [1] - 模型构建"慢思考能力" 融合链式推理与多阶段临床演绎路径建模 实现分阶段推导复杂医疗问题 [2] - 训练方法引入"过程奖励模型"和"结果奖励模型" 分别评估推理链合理性与结论准确性 [2] 数据与资源投入 - 医学数据划分为"可验证"(诊断类)和"不可验证"(健康建议类)两类进行差异化训练 [2] - 夸克拥有千人规模专业医师标注团队 其中超过400名为副主任医师及以上专家 [3] - 人类医生临床数据 诊断经验及数据标注对模型发展至关重要 [3] 商业化探索 - 当前阶段暂未考虑商业化 未来可能涉及健康档案管理 诊疗服务转化 智能互联设备等方向 [4] - 商业化模式仍处于早期探索阶段 尚未形成清晰路径 [4] 应用挑战 - 患者提示词准确性 多模态能力建设直接影响大模型输出质量 [2] - 精神科诊疗需精准挖掘病症与需求点 对模型理解能力提出更高要求 [2]
夸克通过“主任医师级”笔试,健康大模型如何解准确性难题?
第一财经· 2025-07-23 19:24
行业发展趋势 - 全球AI医疗健康市场规模预计从2021年110亿美元增长至2028年1940亿美元 年复合增长率超过41%[1] - 字节、百度、阿里等大型科技公司均在押注健康大模型赛道[1] 技术核心挑战 - 现阶段健康大模型核心痛点是准确性不足[1] - 患者提示词准确性及多模态能力建设影响模型输出效果[2] - 精神科诊疗中需准确挖掘病症并理解患者需求点[2] 技术突破方向 - 夸克健康大模型构建"慢思考能力" 融合链式推理与多阶段临床演绎路径建模[2] - 将医学数据划分为可验证(诊断类)与不可验证(健康建议类)两类[5] - 引入过程奖励模型评估推理链合理性 结果奖励模型评估结论准确性[5] 资源投入现状 - 夸克拥有千人规模专业医师标注团队 其中超过400名为副主任医师及以上专家[5] - 训练重点从医学问题回答转向医学思维培养[5] 商业化进展 - 健康大模型暂未考虑商业化[5] - 未来可能探索方向包括用户健康档案管理、诊疗服务转化及智能互联设备服务[5]