百川智能新一代医疗大模型Baichuan-M3发布 - 百川智能于1月13日正式开源新一代医疗大模型Baichuan-M3 [2] - 在全球权威医疗AI评测HealthBench中,Baichuan-M3以65.1分的综合成绩位列全球第一,刷新了该评测的最高分 [2] - 在专门考验复杂决策能力的HealthBench Hard上,Baichuan-M3以44.4分的成绩夺冠,首次在医疗领域实现了对GPT-5.2的全面超越 [2][5] 模型核心能力与技术突破 - Baichuan-M3具备原生的“端到端”严肃问诊能力,能像医生一样主动追问、逐层逼近,其问诊能力评测显示显著高于真人医生的平均水平 [4][6] - 模型在低幻觉领域表现卓越,医疗幻觉率仅为3.5%,为全球最低,超越了GPT-5.2 [2][6] - 公司通过升级强化学习系统,将半动态反馈升级为全动态Verifier System,使模型在复杂医学问题上的表现实现跃迁 [5] - 模型将医疗幻觉抑制前移至训练阶段,将医学事实一致性作为核心训练目标,使事实可靠性内化为模型自身的基础能力 [6] 评测体系与产品应用 - 百川智能联合150多位一线医生,借鉴医学教育中的OSCE方法,搭建了SCAN-bench评测体系,该体系以真实临床经验为标准,完整模拟医生从接诊到确诊的全过程 [9] - 医疗应用“百小应”已同步接入M3模型,面向医生与患者开放相关能力 [9] - 对于医生,产品更强调循证,确保引用的信息100%存在;对于患者,产品强调将专业语言翻译成易懂内容,并补充信息,进入启发式端到端的问诊 [31] 公司战略与商业化路径 - 公司预判医疗AI未来巨大的增量是在院外,而非院内,核心是服务患者,推动“医患权力让渡” [9][14] - 商业化路径是To C导向,通过辅助决策和健康陪伴等方式实现,计划向患者收费或形成服务包,也可能与药企合作 [9][22] - 公司计划于2026年上半年开始推进To C产品的商业化落地 [23] - 公司明确短期内不会触碰“诊断结论和治疗方案必须由医生给出”的法规红线,定位是辅助医生和患者,帮助患者做好决策 [24][36] 技术理念与行业观点 - 公司创始人认为,在医疗领域,智力(符号和语言)是模型的中轴,多模态(如图像识别)并非主战场,图像诊断未来会由小模型完成 [10][11] - 强调算法与评测体系的重要性,认为数据并非核心,很多医疗模型“不知道自己在做什么”,行业内“大家都在提数据很重要,但只是传阅的概念,没有人做成功过” [9][15][20] - 公司护城河在于模型领先一代、切入严肃高价值场景的差异化路线,以及不同于大厂注重“共识”的创新产品形态 [33] 发展重点与未来规划 - 公司发展重点病种和场景是全覆盖,并重点布局儿科、慢病和肿瘤领域 [44][58] - 2025年公司发布了M2和M2Plus模型,夯实了医疗增强、循证和问诊的基础;2026年的核心是模型迭代和产品落地 [38] - 公司正在与儿童医院、东肿(疑为东肿瘤医院)等机构以药厂身份合作进行临床试验 [49][62] - 公司有出海计划,并表示“不能出海的医疗公司不是好公司” [51] - 公司正在探索硬件领域,例如睡眠监测相关产品 [59]
对话王小川:“语言才是中轴,多模态不是主战场”
钛媒体APP·2026-01-13 22:52