循证增强大模型 - 财报，业绩电话会，研报，新闻

循证增强大模型

搜索文档

IPO早知道· 2025-10-22 22:38

产品发布与定位 - 百川智能于10月22日发布循证增强医疗大模型Baichuan-M2 Plus，并同步升级应用百小应及开放API [2] - 该产品定位为“医生版ChatGPT”，旨在让大模型技术在辅助临床诊疗场景中迈过“敢用、可用”的关键门槛 [3] - 产品通过百小应应用和网页版向医生及患者提供服务，并开放标准化API接口供医院信息化部门、互联网医疗等机构集成使用 [7][8] 技术优势与性能表现 - Baichuan-M2 Plus首创六源循证推理（EAR）范式，其医疗幻觉率较通用大模型显著降低，相比DeepSeek低约3倍 [2] - 在美国执业医师资格考试（USMLE）中取得97分，与GPT-5成绩持平，远超人类考生平均水平 [4] - 在中国执业医师资格考试（NMLE）中取得568分，超过500分的“学神”级别，在所有公开测试的主流大模型中位列第一 [5] - 在中国硕士研究生招生考试临床医学综合能力（西医）考试中取得282分，该考试280分以上为顶尖学府头部学霸水平 [6] - 在日本、英国、澳大利亚等国高级医师职称晋升考试中，准确率达85%以上，远超各国及格线 [6] - 在全球多等级医疗资格考试中取得85分，优于GPT-5的83.8分和OpenEvidence的81分 [5] 市场竞争与行业影响 - Baichuan-M2 Plus在性能上超越美国最火医疗产品OpenEvidence，后者已有40%美国医生注册使用，月咨询量达1650万次 [2] - OpenEvidence所在公司于近期完成2亿美元C轮融资，估值达60亿美元 [2] - 该产品的推出被视为中国在世界大模型擂台上的又一成果，代表中国在医疗AI领域的竞争力 [3] - 产品为医生提供了应对患者使用DeepSeek等通用模型自诊挑战的“专属武器”，有助于提升临床决策的专业性和效率 [7]

大模型

循证增强大模型

Artificial Intelligence

Artificial Intelligence

Baichuan-M2 Plus

百小应

OpenEvidence

“医生版ChatGPT”来了！百川发布最强循证增强大模型M2 Plus，幻觉率远低于DeepSeek

生物世界· 2025-10-22 16:38

产品发布与市场定位 - 百川智能于2025年10月22日发布循证增强医疗大模型Baichuan-M2 Plus，并同步升级应用百小应及开放API [3] - 该模型旨在解决通用大模型在严肃医疗场景中的幻觉问题，推动技术迈过“敢用、可用”的关键门槛 [4] - 产品定位为“医生版ChatGPT”，不仅在美、日、英的医疗评测中超过美国领先产品OpenEvidence，也适合中国医疗环境 [4] 核心技术：六源循证推理范式 - 首创六源循证推理范式，构建从原始研究到真实世界的完整知识体系，包含六个层级 [5][6][8] - 原始研究层索引超过4000万篇医学期刊论文，数量超过PubMed [8] - 证据综述层整合系统评价和Meta分析等高等级证据 [8] - 指南规范层引入国际和国内权威机构发布的临床指南和专家共识 [8] - 实践知识层包含临床病例报道和一线专家经验 [8] - 公共健康教育层汇集权威科普和公共卫生知识 [8] - 监管与真实世界层涵盖药监部门公告和真实世界研究数据 [8] 技术优势与性能表现 - 模型幻觉率显著降低，仅为DeepSeek最新版的三分之一，并优于OpenEvidence [3][15] - 在美国执业医师资格考试中取得97分，与GPT-5成绩持平 [19][21] - 在中国执业医师资格考试中取得568分，远超人类高水平考生及同类模型 [19][21] - 在中国硕士研究生招生考试临床医学综合能力考试中取得282分 [20][21] - 在日本、英国、澳大利亚等国高级医师职称晋升考试中准确率达85%以上 [20] 检索与推理技术突破 - 采用PICO框架将查询转化为结构化医学问题，在六源数据库中进行分层匹配 [11] - 通过三步精准锁定证据：智能提问、精准锁定、证据排序 [11][12] - 引入循证增强训练机制，奖励模型准确引用权威来源，惩罚脱离证据的臆测 [13] - 模型输出关键结论时会自动附上参考文献和指南出处，实现可回溯和可验证 [13] 应用场景与生态建设 - 接入M2 Plus的百小应应用已在各大手机应用商店更新，并同步上线网页版 [23] - 为医生提供应对患者使用通用大模型自诊的“专属武器”，帮助甄别信息真伪 [23] - 为患者及家属提供理解诊疗方案背后科学逻辑的渠道，获得权威知识解答 [23] - 开放标准化API接口，供医院信息化部门、互联网医疗及开发者接入服务场景 [23] 行业对标与竞争格局 - 美国产品OpenEvidence已有40%美国医生在临床场景中注册使用，月咨询量达1650万次 [3] - OpenEvidence所在公司近期完成2亿美元C轮融资，估值达60亿美元 [3] - 百川M2 Plus在多项关键评测中超越OpenEvidence，代表中国在医疗大模型领域取得进展 [4][21]