百川智能发布Baichuan-M2医疗大模型 - 百川智能于8月11日推出开源医疗增强推理大模型Baichuan-M2 参数量32B 是公司开源的第二个医疗增强大模型 专门为真实世界医疗推理任务设计 [1] - 该模型在OpenAI官方医疗评测集HealthBench上综合成绩超越OpenAI开源的120B模型gpt-oss-120b 成为开源领域最接近GPT-5医疗能力的标杆模型 [1] - 模型在HealthBench Hard任务上优势明显 在HealthBench和HealthBench Hard上超越o3、Grok3、Gemini 2.5 Pro、GPT-4.1等顶尖闭源模型 与GPT-5是HealthBench上唯二超越32分的模型 [5] 技术突破与创新 - 模型通过技术创新显著提升AI医生在复杂诊疗场景中的思维与沟通能力 更贴近真实医生的专业决策与互动方式 [2] - 引入"患者模拟器"系统 基于真实病例构建上万个不同年龄、性别、症状的AI患者 模拟数百万次诊疗过程 生成具有不同教育背景和表达能力的虚拟患者 [11] - 验证系统通过动态生成评分标准 在端到端强化学习中实时优化AI医生决策质量 将静态奖励规则升级为基于真实场景交互的动态智能评估体系 [13] 落地应用优势 - 以极低部署成本在HealthBench取得优秀效果 相比gpt-oss-120b前移帕累托前沿 提升模型落地可能性与可扩展性 [8] - 在中国本土医疗场景中展现出比国际模型更精准的临床适配性 在中国临床诊疗场景问题评测中对比gpt-oss系列模型显示出更明显可用性优势 [8] - 具体案例显示 面对55岁肝癌患者复杂病例时 基于中国卫健委《原发性肝癌诊疗指南》推荐"解剖性肝右叶切除"方案 与国内临床实践完全吻合 而gpt-oss-120b建议TACE方案 显示对中国诊疗规范理解偏差 [8] 行业发展背景 - 医疗作为关键垂直领域成为全球AI新势力追逐的核心赛道 OpenAI在GPT-5发布会重点展示医疗健康领域突破 医疗能力在模型评测体系中权重不断提升 [15] - 2025年美国新晋AI独角兽中医疗AI公司占比超50% 其中Abridge估值53亿美元 OpenEvidence估值35亿美元 Hippocratic AI估值16.4亿美元 [15] - 百川智能已与北京儿童医院、北京大学第三医院、海淀卫健委等展开深度合作 加速医疗大模型迭代与真实医疗场景实践 [16] 战略意义 - 标志中国医疗AI跻身全球技术第一梯队 展现中国AI产业在医疗关键领域实现全球并跑能力 [1][16] - 公司运用大模型智能体提供近乎无限AI医生供给 通过与真人医生协作实现"双医模式" 让每位医生拥有AI医助 每位患者拥有专属AI医生 [10] - 在OpenAI发布开源医疗模型gpt-oss-120b后5天内做出技术回应并在权威评测中实现反超 展现中国团队在大模型领域技术锐度与执行力 [16]
全球重注医疗AI的关键时刻,百川智能丢下“重磅炸弹”
36氪·2025-08-12 17:33