无惧OpenAI,2026年国内最值得期待的十个医疗大模型
36氪·2026-02-09 09:31

全球医疗大模型竞争格局 - 2026年1月初,OpenAI首次推出官方医疗健康专用模块,包括面向个人用户的ChatGPT Health和面向医疗机构的OpenAI for Healthcare,后者已有数千家AI企业通过配置其API支持符合HIPAA标准的应用 [1][2] - OpenAI的主要竞争对手迅速跟进,Anthropic在JPM大会上发布直接对标的Claude for Healthcare,谷歌则更新了开源医疗大模型MedGemma 1.5 (4B)并发布开源自动语音识别模型MedASR [1][3] - 全球顶尖大模型企业在2026开年不到半月内纷纷重注医疗,显示该领域的战略价值和火热程度 [4] 国产医疗大模型的竞争力与优势 - 国内大模型在性能上具备竞争力,百川智能发布的Baichuan-M3在全球权威医疗基准测试HealthBench和HealthBench Hard中分别以65.1分和44.4分夺冠,幻觉率仅3.5%,实现对GPT-5.2的超越,随后发布的Baichuan-M3 Plus将幻觉率进一步降低至2.6% [4][5] - 国内大模型用户规模增长迅速,蚂蚁阿福月活跃用户数已达3000万,用户单日提问量超1000万,仅一个月时间翻倍 [5] - 国产大模型在本地化支持上优势明显,训练数据以汉语为主,深度整合中国临床指南、医保目录、DRG/DIP控费规则,并针对中国特色场景进行优化 [6] - 开源模式推动国内大模型发展,以DeepSeek为首的国产开源大模型影响力提升,在全球最大的AI开源社区Hugging Face上的下载量已超越美国,促使许多国内医疗应用从OpenAI GPT模型切换至国产大模型 [5] - 政策支持明确,中国提出到2027年形成一批临床专病专科垂直大模型和智能体应用,到2030年基层诊疗智能辅助基本实现全覆盖 [6] 医疗大模型性能评估体系 - 全球权威的医疗大模型性能基准测试主要包括OpenAI开发的HealthBench和上海人工智能实验室发布的MedBench [7] - HealthBench联合了来自60个国家和地区的262位执业医师共同构建,收录了5000份真实医疗对话场景 [7] - MedBench是国内首个面向垂直大模型的评测体系,已升级至4.0版本,覆盖大语言模型、多模态大模型及智能体三大类,构建共60个评测集70余万专业评测题 [7] 2026年值得关注的国产主流医疗大模型 - 百川智能Baichuan-M3:评测性能超越GPT-5.2,创下最低幻觉率纪录,并与首都医科大学附属北京儿童医院合作首个儿科大模型 [9][17] - 百度灵医大模型:国内首个“产业级”及首批商业化落地医疗大模型,投入千亿Token优质医疗健康训练语料,覆盖300万+多模态影像数据、5亿+条权威健康科普内容等,已覆盖800+医院、4000+基层医疗机构 [10][19] - 方舟健客杏石医疗大模型:慢病管理全链条闭环覆盖创新模式被Nature关注报道,整合中华医学会170多种核心期刊超110万篇文章,已累计为医生提供近40万次技术辅助,节省超6万小时工作时间,患者单次问诊时间缩短70%以上 [10][20] - 京东健康京医千询医疗大模型:国内医疗行业首个全面开源的垂类大模型,已成为应用场景最丰富、与医院共建最深、合作医生最多、参与用户最广泛的医疗垂类大模型之一 [11][21] - 蚂蚁·多模态医疗大模型:依托超万亿tokens专业医疗语料底座,支撑自主研发千亿参数多模态模型,是国内首个通过国家信通院医疗健康行业大模型双领域可信评估的大模型,在国内外评测榜单中名列前茅 [11][22] - 腾讯健康医疗大模型:基于腾讯混元大模型底座,可能是目前在基层应用最为广泛的医疗大模型之一,其驱动的AI导辅诊服务在全国近10000家各级医疗机构得到应用,各类“开箱即用”的医疗AI解决方案服务超过1300家机构 [12][23] - 微医医疗大模型:在MedBench评测榜单中表现突出,其2025年上半年AI医疗服务收入已达总营收九成以上,按2024年收入统计,在中国数字健康服务市场及AI医疗健康解决方案市场中均位列第一 [12] - 讯飞星火医疗大模型:专科诊断合理率提升至96%,病历书写时间减少50%,基于该模型的医生助理已覆盖全国801个区县,累计提供11亿次辅助诊断,AI健康助手下载量突破2400万次,完成超1.6亿次AI健康咨询 [13] - 医渡科技大模型:已授权处理覆盖超过10000家医院共13亿患者人次的近70亿份医疗记录,在第十一届中国健康信息处理大会上荣获“医学NLP代码自动生成测评”冠军及“最佳论文奖” [13] - 未来医生大模型:证实其与三甲主治医师诊疗一致性达到96%,其探索医疗AI临床适用性的评估标准CSEDB研究成果发表于npj Digital Medicine [13] 其他特色国产医疗大模型参与者 - 数坤的多模态医疗大模型及相关智能体已在全国5000余家医院中应用,覆盖诊疗、管理与健康全流程,实现“体系级落地能力” [28] - 镁信健康自主研发的mind42.ai平台面向医疗支付与服务场景,截至2025年12月已累计服务覆盖4.43亿保单量 [29] - 包括阿里达摩院、联影、脉得智能、深睿、东软集团、福鑫、浪潮健康等以往专注于AI影像或医疗信息化的企业及机构也纷纷进军大模型领域 [28][29]