把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录
量子位·2026-01-23 20:09

文章核心观点 - AI正悄然成为公众日常寻医问诊的前置入口,但在严肃医疗领域,其落地需克服信任与成本两大障碍[1][5] - 百川智能通过发布循证增强医疗大模型Baichuan-M3 Plus,以极低的幻觉率和引用准确率,并结合大幅降低的成本与免费开放计划,旨在让AI成为医生可信赖的助手并惠及患者[6][7][23][24][61] 行业现状与趋势 - AI已成为普通人就医流程中的常见前置入口[1] - 医疗界对AI发展趋势的判断基本一致,年轻医生群体正积极尝试使用AI[2][4] - 国内有上千家医院和数百亿投入的专项工程正在探索AI应用[54] 百川智能医疗大模型的技术突破 - 幻觉率降至全球最低:Baichuan-M3 Plus凭借六源循证等技术,将幻觉率降低至2.6%,低于业内标杆产品及部分人类医生的平均误判率[6][8][16][19] - 评测表现领先:其前代M3版本在OpenAI的HealthBench评测集上夺得全球第一,反超GPT-5.2 High,当时幻觉率已压低至3.5%[11][14] - 核心技术:采用Fact-Aware RL(事实感知强化学习)和Citation Reward Model,在训练中引入医学事实硬性约束并惩罚错误引用,让模型对幻觉产生“过敏反应”[12][13] 成本优化与可及性 - 调用成本大幅降低:通过MoE架构优化、模型量化及Gated Eagle-3投机解码等工程优化,M3 Plus的API调用成本较上一代降低70%[21] - 推理效率提升:Gated Eagle-3相较原始Eagle-3可带来约15%的推理吞吐量提升,从而直接压低单位请求成本[22] 创新技术:证据锚定 - 解决行业痛点:针对医疗大模型常见的“张冠李戴”和“内容冲突”等引用不准确问题(行业常见引用准确率区间为40%到50%)[26][27][28] - 技术原理:引入“证据锚定”技术,约束模型必须为每一句关键医学判断在原始证据中找到精确对应的段落,否则不应说出该结论[32][33] - 效果显著:将模型的引用准确率从行业普遍的约75%提升至95%以上[46] - 证据来源广泛:包括药品说明书、中英文文献、专家共识等[35][37][39] 市场推广与生态建设 - 推出“海纳百川”免费计划:将M3 Plus以API形式永久免费开放给服务医务工作者的机构,不限Token数量,旨在推动技术普惠与行业验证[47][48][54] - 计划成本估算:若全国500万医学工作者都使用,公司预计一年投入成本约1亿元,认为是可以接受的[56] - 用户基础:公司专业版模型已有约10万医生用户,且年轻用户居多[2]