循证增强大模型
搜索文档
百川智能发布最强循证增强大模型M2 Plus,打造“医生版ChatGPT”
IPO早知道· 2025-10-22 22:38
产品发布与定位 - 百川智能于10月22日发布循证增强医疗大模型Baichuan-M2 Plus,并同步升级应用百小应及开放API [2] - 该产品定位为“医生版ChatGPT”,旨在让大模型技术在辅助临床诊疗场景中迈过“敢用、可用”的关键门槛 [3] - 产品通过百小应应用和网页版向医生及患者提供服务,并开放标准化API接口供医院信息化部门、互联网医疗等机构集成使用 [7][8] 技术优势与性能表现 - Baichuan-M2 Plus首创六源循证推理(EAR)范式,其医疗幻觉率较通用大模型显著降低,相比DeepSeek低约3倍 [2] - 在美国执业医师资格考试(USMLE)中取得97分,与GPT-5成绩持平,远超人类考生平均水平 [4] - 在中国执业医师资格考试(NMLE)中取得568分,超过500分的“学神”级别,在所有公开测试的主流大模型中位列第一 [5] - 在中国硕士研究生招生考试临床医学综合能力(西医)考试中取得282分,该考试280分以上为顶尖学府头部学霸水平 [6] - 在日本、英国、澳大利亚等国高级医师职称晋升考试中,准确率达85%以上,远超各国及格线 [6] - 在全球多等级医疗资格考试中取得85分,优于GPT-5的83.8分和OpenEvidence的81分 [5] 市场竞争与行业影响 - Baichuan-M2 Plus在性能上超越美国最火医疗产品OpenEvidence,后者已有40%美国医生注册使用,月咨询量达1650万次 [2] - OpenEvidence所在公司于近期完成2亿美元C轮融资,估值达60亿美元 [2] - 该产品的推出被视为中国在世界大模型擂台上的又一成果,代表中国在医疗AI领域的竞争力 [3] - 产品为医生提供了应对患者使用DeepSeek等通用模型自诊挑战的“专属武器”,有助于提升临床决策的专业性和效率 [7]
“医生版ChatGPT”来了!百川发布最强循证增强大模型M2 Plus,幻觉率远低于DeepSeek
生物世界· 2025-10-22 16:38
产品发布与市场定位 - 百川智能于2025年10月22日发布循证增强医疗大模型Baichuan-M2 Plus,并同步升级应用百小应及开放API [3] - 该模型旨在解决通用大模型在严肃医疗场景中的幻觉问题,推动技术迈过“敢用、可用”的关键门槛 [4] - 产品定位为“医生版ChatGPT”,不仅在美、日、英的医疗评测中超过美国领先产品OpenEvidence,也适合中国医疗环境 [4] 核心技术:六源循证推理范式 - 首创六源循证推理范式,构建从原始研究到真实世界的完整知识体系,包含六个层级 [5][6][8] - 原始研究层索引超过4000万篇医学期刊论文,数量超过PubMed [8] - 证据综述层整合系统评价和Meta分析等高等级证据 [8] - 指南规范层引入国际和国内权威机构发布的临床指南和专家共识 [8] - 实践知识层包含临床病例报道和一线专家经验 [8] - 公共健康教育层汇集权威科普和公共卫生知识 [8] - 监管与真实世界层涵盖药监部门公告和真实世界研究数据 [8] 技术优势与性能表现 - 模型幻觉率显著降低,仅为DeepSeek最新版的三分之一,并优于OpenEvidence [3][15] - 在美国执业医师资格考试中取得97分,与GPT-5成绩持平 [19][21] - 在中国执业医师资格考试中取得568分,远超人类高水平考生及同类模型 [19][21] - 在中国硕士研究生招生考试临床医学综合能力考试中取得282分 [20][21] - 在日本、英国、澳大利亚等国高级医师职称晋升考试中准确率达85%以上 [20] 检索与推理技术突破 - 采用PICO框架将查询转化为结构化医学问题,在六源数据库中进行分层匹配 [11] - 通过三步精准锁定证据:智能提问、精准锁定、证据排序 [11][12] - 引入循证增强训练机制,奖励模型准确引用权威来源,惩罚脱离证据的臆测 [13] - 模型输出关键结论时会自动附上参考文献和指南出处,实现可回溯和可验证 [13] 应用场景与生态建设 - 接入M2 Plus的百小应应用已在各大手机应用商店更新,并同步上线网页版 [23] - 为医生提供应对患者使用通用大模型自诊的“专属武器”,帮助甄别信息真伪 [23] - 为患者及家属提供理解诊疗方案背后科学逻辑的渠道,获得权威知识解答 [23] - 开放标准化API接口,供医院信息化部门、互联网医疗及开发者接入服务场景 [23] 行业对标与竞争格局 - 美国产品OpenEvidence已有40%美国医生在临床场景中注册使用,月咨询量达1650万次 [3] - OpenEvidence所在公司近期完成2亿美元C轮融资,估值达60亿美元 [3] - 百川M2 Plus在多项关键评测中超越OpenEvidence,代表中国在医疗大模型领域取得进展 [4][21]