全球重注医疗AI的关键时刻，百川智能丢下“重磅炸弹”

百川智能发布Baichuan-M2医疗大模型 - 百川智能于8月11日推出开源医疗增强推理大模型Baichuan-M2 参数量32B 是公司开源的第二个医疗增强大模型专门为真实世界医疗推理任务设计 [1] - 该模型在OpenAI官方医疗评测集HealthBench上综合成绩超越OpenAI开源的120B模型gpt-oss-120b 成为开源领域最接近GPT-5医疗能力的标杆模型 [1] - 模型在HealthBench Hard任务上优势明显在HealthBench和HealthBench Hard上超越o3、Grok3、Gemini 2.5 Pro、GPT-4.1等顶尖闭源模型与GPT-5是HealthBench上唯二超越32分的模型 [5] 技术突破与创新 - 模型通过技术创新显著提升AI医生在复杂诊疗场景中的思维与沟通能力更贴近真实医生的专业决策与互动方式 [2] - 引入"患者模拟器"系统基于真实病例构建上万个不同年龄、性别、症状的AI患者模拟数百万次诊疗过程生成具有不同教育背景和表达能力的虚拟患者 [11] - 验证系统通过动态生成评分标准在端到端强化学习中实时优化AI医生决策质量将静态奖励规则升级为基于真实场景交互的动态智能评估体系 [13] 落地应用优势 - 以极低部署成本在HealthBench取得优秀效果相比gpt-oss-120b前移帕累托前沿提升模型落地可能性与可扩展性 [8] - 在中国本土医疗场景中展现出比国际模型更精准的临床适配性在中国临床诊疗场景问题评测中对比gpt-oss系列模型显示出更明显可用性优势 [8] - 具体案例显示面对55岁肝癌患者复杂病例时基于中国卫健委《原发性肝癌诊疗指南》推荐"解剖性肝右叶切除"方案与国内临床实践完全吻合而gpt-oss-120b建议TACE方案显示对中国诊疗规范理解偏差 [8] 行业发展背景 - 医疗作为关键垂直领域成为全球AI新势力追逐的核心赛道 OpenAI在GPT-5发布会重点展示医疗健康领域突破医疗能力在模型评测体系中权重不断提升 [15] - 2025年美国新晋AI独角兽中医疗AI公司占比超50% 其中Abridge估值53亿美元 OpenEvidence估值35亿美元 Hippocratic AI估值16.4亿美元 [15] - 百川智能已与北京儿童医院、北京大学第三医院、海淀卫健委等展开深度合作加速医疗大模型迭代与真实医疗场景实践 [16] 战略意义 - 标志中国医疗AI跻身全球技术第一梯队展现中国AI产业在医疗关键领域实现全球并跑能力 [1][16] - 公司运用大模型智能体提供近乎无限AI医生供给通过与真人医生协作实现"双医模式" 让每位医生拥有AI医助每位患者拥有专属AI医生 [10] - 在OpenAI发布开源医疗模型gpt-oss-120b后5天内做出技术回应并在权威评测中实现反超展现中国团队在大模型领域技术锐度与执行力 [16]