对话王小川：“语言才是中轴，多模态不是主战场”

百川智能新一代医疗大模型Baichuan-M3发布 - 百川智能于1月13日正式开源新一代医疗大模型Baichuan-M3 [2] - 在全球权威医疗AI评测HealthBench中，Baichuan-M3以65.1分的综合成绩位列全球第一，刷新了该评测的最高分 [2] - 在专门考验复杂决策能力的HealthBench Hard上，Baichuan-M3以44.4分的成绩夺冠，首次在医疗领域实现了对GPT-5.2的全面超越 [2][5] 模型核心能力与技术突破 - Baichuan-M3具备原生的“端到端”严肃问诊能力，能像医生一样主动追问、逐层逼近，其问诊能力评测显示显著高于真人医生的平均水平 [4][6] - 模型在低幻觉领域表现卓越，医疗幻觉率仅为3.5%，为全球最低，超越了GPT-5.2 [2][6] - 公司通过升级强化学习系统，将半动态反馈升级为全动态Verifier System，使模型在复杂医学问题上的表现实现跃迁 [5] - 模型将医疗幻觉抑制前移至训练阶段，将医学事实一致性作为核心训练目标，使事实可靠性内化为模型自身的基础能力 [6] 评测体系与产品应用 - 百川智能联合150多位一线医生，借鉴医学教育中的OSCE方法，搭建了SCAN-bench评测体系，该体系以真实临床经验为标准，完整模拟医生从接诊到确诊的全过程 [9] - 医疗应用“百小应”已同步接入M3模型，面向医生与患者开放相关能力 [9] - 对于医生，产品更强调循证，确保引用的信息100%存在；对于患者，产品强调将专业语言翻译成易懂内容，并补充信息，进入启发式端到端的问诊 [31] 公司战略与商业化路径 - 公司预判医疗AI未来巨大的增量是在院外，而非院内，核心是服务患者，推动“医患权力让渡” [9][14] - 商业化路径是To C导向，通过辅助决策和健康陪伴等方式实现，计划向患者收费或形成服务包，也可能与药企合作 [9][22] - 公司计划于2026年上半年开始推进To C产品的商业化落地 [23] - 公司明确短期内不会触碰“诊断结论和治疗方案必须由医生给出”的法规红线，定位是辅助医生和患者，帮助患者做好决策 [24][36] 技术理念与行业观点 - 公司创始人认为，在医疗领域，智力（符号和语言）是模型的中轴，多模态（如图像识别）并非主战场，图像诊断未来会由小模型完成 [10][11] - 强调算法与评测体系的重要性，认为数据并非核心，很多医疗模型“不知道自己在做什么”，行业内“大家都在提数据很重要，但只是传阅的概念，没有人做成功过” [9][15][20] - 公司护城河在于模型领先一代、切入严肃高价值场景的差异化路线，以及不同于大厂注重“共识”的创新产品形态 [33] 发展重点与未来规划 - 公司发展重点病种和场景是全覆盖，并重点布局儿科、慢病和肿瘤领域 [44][58] - 2025年公司发布了M2和M2Plus模型，夯实了医疗增强、循证和问诊的基础；2026年的核心是模型迭代和产品落地 [38] - 公司正在与儿童医院、东肿（疑为东肿瘤医院）等机构以药厂身份合作进行临床试验 [49][62] - 公司有出海计划，并表示“不能出海的医疗公司不是好公司” [51] - 公司正在探索硬件领域，例如睡眠监测相关产品 [59]