医疗AI
搜索文档
把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录
量子位· 2026-01-23 20:09
文章核心观点 - AI正悄然成为公众日常寻医问诊的前置入口,但在严肃医疗领域,其落地需克服信任与成本两大障碍[1][5] - 百川智能通过发布循证增强医疗大模型Baichuan-M3 Plus,以极低的幻觉率和引用准确率,并结合大幅降低的成本与免费开放计划,旨在让AI成为医生可信赖的助手并惠及患者[6][7][23][24][61] 行业现状与趋势 - AI已成为普通人就医流程中的常见前置入口[1] - 医疗界对AI发展趋势的判断基本一致,年轻医生群体正积极尝试使用AI[2][4] - 国内有上千家医院和数百亿投入的专项工程正在探索AI应用[54] 百川智能医疗大模型的技术突破 - **幻觉率降至全球最低**:Baichuan-M3 Plus凭借六源循证等技术,将幻觉率降低至**2.6%**,低于业内标杆产品及部分人类医生的平均误判率[6][8][16][19] - **评测表现领先**:其前代M3版本在OpenAI的HealthBench评测集上夺得全球第一,反超GPT-5.2 High,当时幻觉率已压低至**3.5%**[11][14] - **核心技术**:采用Fact-Aware RL(事实感知强化学习)和Citation Reward Model,在训练中引入医学事实硬性约束并惩罚错误引用,让模型对幻觉产生“过敏反应”[12][13] 成本优化与可及性 - **调用成本大幅降低**:通过MoE架构优化、模型量化及Gated Eagle-3投机解码等工程优化,M3 Plus的API调用成本较上一代降低**70%**[21] - **推理效率提升**:Gated Eagle-3相较原始Eagle-3可带来约**15%**的推理吞吐量提升,从而直接压低单位请求成本[22] 创新技术:证据锚定 - **解决行业痛点**:针对医疗大模型常见的“张冠李戴”和“内容冲突”等引用不准确问题(行业常见引用准确率区间为**40%到50%**)[26][27][28] - **技术原理**:引入“证据锚定”技术,约束模型必须为每一句关键医学判断在原始证据中找到精确对应的段落,否则不应说出该结论[32][33] - **效果显著**:将模型的引用准确率从行业普遍的约**75%**提升至**95%**以上[46] - **证据来源广泛**:包括药品说明书、中英文文献、专家共识等[35][37][39] 市场推广与生态建设 - **推出“海纳百川”免费计划**:将M3 Plus以API形式永久免费开放给服务医务工作者的机构,不限Token数量,旨在推动技术普惠与行业验证[47][48][54] - **计划成本估算**:若全国**500万**医学工作者都使用,公司预计一年投入成本约**1亿元**,认为是可以接受的[56] - **用户基础**:公司专业版模型已有约**10万**医生用户,且年轻用户居多[2]
王小川批医疗AI“假东西太多”,新模型幻觉率仅2.6%,两周免费
36氪· 2026-01-23 08:42
1月22日,百川智能发布了Baichuan-M3-Plus询证增强医疗大模型,这一模型采用了M2-Plus同款的"六源询证"方法,再次刷新行业SOTA,幻 觉率仅为2.6%。 此外,Baichuan-M3-Plus还首创了"证据锚定"技术,让AI回答中的每个结论和证据都能精准匹配到原文献的具体位置,据称匹配率高达95%, 远超行业40%-50%的平均水准。 这一模型采用API模式对外提供服务,价格较前代模型下降70%,并在发布后两周内免费,为医务工作者提供服务的机构可通过"海纳百川计 划"长期免费使用。 Baichuan-M3-Plus发布之际,智东西等媒体来到百川总部与百川智能创始人兼CEO王小川和百川智能模型技术负责人鞠强面对面沟通,他们分 享了M3 Plus背后的技术细节,以及对行业热点议题的看法。 在交流中,王小川多次强调,医疗AI的核心目标应始终指向患者利益本身。他主动回应了近期张文宏关于"拒绝在病历系统中引入AI、担心影 响年轻医生成长"的观点,直言如果因为担忧AI影响医生训练而限制其应用,本质上就是将当下的患者作为医生成长的成本。 当智东西问及百川目前API客户群体的画像时,王小川回应道,M3发 ...
直击达沃斯|对话医渡科技宫如璟:生命科学是星辰大海,医疗AI仍处早期
新浪财经· 2026-01-22 15:15
公司战略与业务布局 - 公司自2014年创立以来,始终围绕“数据智能,绿色医疗”的战略展开布局,致力于解决医疗领域的供应链与成本问题,涵盖医生时间、药企研发、保险等多个环节 [2][11] - 公司已构建“大数据+大模型+智能体”的一体化技术架构,旨在实现诊疗全流程的轻量化集成辅助,并推动AI“能力共创” [2][11] - 公司业务主要聚焦三大方向:为医院和医生提供AI工具(如临床医生Copilot)、助力药企新药研发(包括AI CRO)、以及通过AI赋能保险业务以降低成本并扩大覆盖范围 [3][11][12] 运营数据与市场进展 - 公司过去十年持续投入数据治理,已为医院、药企、保险机构及区域平台处理了超过70亿份医疗记录 [2][11] - 在合作的某家医院中,约70%的医生每天都会使用自己创建的“智能体”协助工作 [3][11] - 在保险业务方面,公司已参与北京普惠健康保、深圳惠民保等项目,并通过AI赋能实现理赔“秒级”到账 [3][12][14] - 在文莱推出的全民健康APP(BruHealth)已覆盖近90%的人口,用户日均步数从初期的约2000步提升至目前的8000步 [5][14] 行业发展阶段与特点 - 医疗AI行业的长期目标是构建覆盖全链条的体系,但目前行业仍处于发展早期,未来前景广阔 [1][8] - 如果以100分为成熟标准,当前行业可能仅处于“0.01”的阶段,主要由于物理世界的数据仍不完善,对很多疾病的理解尚不充分 [4][13] - 行业未来有望实现指数级发展,前期是线性积累,待基础夯实后将迎来爆发式成长 [4][13] - 医疗AI是人工智能的专业细分领域,具有高度严肃性,不同应用场景对AI的要求差异显著,因此与通用大语言模型存在本质区别 [4][13] 国际化与出海战略 - 公司已在文莱、新加坡等地落地相关解决方案,并计划进一步拓展海外市场 [1][9] - 疫情期间,多个国家邀请公司协助开发传染病模拟仿真AI系统,验证了其交付能力 [5][14] - 公司在新加坡与SingHealth、A*Star等机构展开合作 [5][14] - 公司计划进入更多东南亚市场,推动解决方案本地化落地,并计划拓展至欧洲,坚持在每一地区寻找合作伙伴 [5][14] 核心发展理念 - 医疗AI每一个细分疾病领域都充满挑战,从底层模型、医疗知识图谱到具体应用,均需持续投入与打磨,用户体验的提升需要时间 [6][15] - 行业处于早期阶段,众多参与者是行业健康发展的体现,最终竞争力取决于能否为客户创造真实价值 [6][7][15][16]
卫宁健康:公司主营业务未涉及GEO,也暂无相关考虑
新浪财经· 2026-01-21 15:57
公司业务澄清 - 公司主营业务未涉及GEO 且暂无相关考虑 [1] AI业务进展 - 公司AI大模型及相关医疗AI产品已取得部分客户合同 [1] - 相关业务目前仍处于早期阶段 [1] - 相关业务累计合同金额不大 占公司总体合同金额的比重还较低 [1]
卫宁健康(300253.SZ):主营业务未涉及GEO
格隆汇APP· 2026-01-21 15:57
公司业务澄清 - 公司主营业务未涉及GEO 且暂无相关考虑 [1] AI业务进展 - 公司AI大模型及相关医疗AI产品已取得部分客户合同 [1] - 相关业务目前仍处于早期阶段 [1] - AI业务累计合同金额不大 占公司总体合同金额的比重还较低 [1]
中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠
量子位· 2026-01-21 12:09
行业标准与评估框架 - 中国团队在《npj Digital Medicine》(JCR影响因子15.1,中科院医学大类1区Top期刊)上首次发表了用于评估医疗大模型真实临床能力的系统性框架研究[1] - 该框架名为CSEDB(临床安全性与有效性双轨基准),首次基于临床专家共识,将安全性与有效性分开考量,为评估医疗AI真实临床能力建立了标准化基准[4] - CSEDB的评估逻辑核心并非模型“知道多少”,而是关注模型“如果这样判断,会发生什么”,即以医疗后果为中心[21] - 该框架在指标设计中引入了风险权重机制,根据潜在临床风险赋予1到5级权重,涉及误诊、禁忌用药等高风险的指标对总评分影响显著[16][17] - 为支撑评估,专家团队构建了覆盖26个临床专科、包含2069个开放式问答条目的数据集,场景高度贴近一线实际临床病例推演[20] - 该框架从根本上改变了评估目标,兼具专业性和完整性,方法论可复现、可推广,具备部署导向和监管友好性[22] - 行业竞争正从能力展示阶段进入责任定义阶段,CSEDB的发布被视为一个清晰的市场信号[8] 模型评估结果 - 在CSEDB框架下,专家团队评估了包括DeepSeek-R1、OpenAI o3、Gemini-2.5、Qwen3-235B、Claude-3.7在内的全球主流大模型[26] - 评估结果显示,在总体得分、安全性和有效性三个核心维度上,中国未来医生团队推出的MedGPT均位列第一[27] - MedGPT在安全性指标上与其他模型拉开了显著差距,并且是唯一一个在安全性评分上超过有效性的模型[28] 领先模型技术架构 - MedGPT是一个原生为临床使用场景设计的医疗大模型,其核心架构设计了快慢双系统模式[30][31] - “快系统”针对高度常规、路径清晰、风险可控的临床场景,采用轻量化推理结构,在医学知识约束下快速生成结论,响应时间可压缩到百毫秒量级[32][33] - “慢系统”针对高复杂度、高风险场景,会主动拉长推理链,引入多阶段临床演绎路径,并进行交叉校验[36] - 系统会根据问题的风险等级、信息不确定性及潜在后果,动态决定是否从快系统升级到慢系统[36] - 模型引入了专门的风险调和与控制机制“ACC层”来处理两套系统输出之间的冲突,当结论不一致时会优先触发风险约束,必要时拒绝输出并引导转向人工就医[37][38] - 模型通过结构化方式内化了医学知识体系,使推理更接近医学决策的真实路径[39] - 模型在持续使用中进化,每周来自超过一万名医生的两万条诊疗反馈会纳入训练,形成数据飞轮,每月准确率稳定提升1.2%-1.5%[40] 核心工程与竞争壁垒 - MedGPT的核心壁垒体现在医学逻辑被显式建模、临床风险被量化控制以及临床反馈形成的动态闭环三层机制的叠加[46] - 医学逻辑显式建模:将临床决策过程拆解为从病史分析到结论验证的结构化路径,每一步对应明确的医学知识来源和校验规则,形成可追溯的逻辑链条[42][43] - 临床风险量化控制:通过快慢系统分流和ACC层风险调和,将风险前置到推理过程中,在高风险场景下主动提高验证门槛或触发拒答[44][45] - 临床反馈动态闭环:真实诊疗反馈直接作用于慢系统的推理路径修正和风险策略调整,牵引模型的进化方向[46] - 这些工程化能力让产品划清了责任边界,构成了其难以被简单复刻的核心壁垒[45][46] 产品化与商业路径 - 未来医生以通过CSEDB严格验证的MedGPT为核心引擎,构建了精准匹配不同医疗角色与场景的产品矩阵[49][52] - 产品矩阵包括为患者提供7*24小时严肃诊疗服务的“未来医生”,以及深度嵌入医生诊疗决策流程的“未来医生AI工作室”[57] - 在基层医疗场景下,推出了为资源有限机构提供辅助支持的“未来家医”[52] - 技术通过CSEDB验证获得“准生证”,产品矩阵则将其置于真实场景中反复淬炼,二者相互牵引,驱动系统向更可用、更可控的方向持续演进[53] - 公司目标是通过AI新技术实现优质医疗资源的无限复制,改变医疗资源供给不足的困境,最终使高品质的健康与医疗服务变得人人可及[52] - 医疗AI的竞争正从追求榜单上的智能,转向兑现诊疗中的信任,技术、评估、产品三者的协同成为能否深入临床的决定性因素[56]
大厂AI,激战医疗
创业邦· 2026-01-21 11:45
文章核心观点 - 医疗AI赛道正迎来以大型科技公司为主导的新一轮布局热潮,其战略定位从过去的“取代”转向“辅助与赋能”,致力于构建“医、药、险、检”一体化的服务生态[7] - 尽管市场兴趣回升且需求真实存在,但医疗AI的商业化路径、数据质量、责任界定等核心挑战依然悬而未决,行业具有长周期、高门槛的特性[8][30] 平台派 VS 专业派:大厂医疗AI的两种打法 - 主要互联网公司的战略路径分化为“横向平台化”与“纵向专业化”两类[10] - **横向平台化玩家**(如蚂蚁、百度、京东健康)利用既有生态优势,目标是覆盖医疗健康服务全流程[10] - **蚂蚁集团“阿福”**:核心功能整合智能设备数据、医疗知识库与名医资源,并打通支付宝医保支付与好大夫在线医生网络,能提供从咨询到挂号、支付、购药的端到端服务体验[12] - **百度“文心健康管家”**:依托搜索流量与文心大模型,采用“AI+真人”双保障模式,挑战在于用户心智仍停留在信息搜索,且缺乏支付、电商等关键场景的闭环能力[13] - **京东健康“康康”**:依托京东物流与供应链体系,实现AI问诊、药品即时配送与线下服务深度绑定,核心收入仍为医药零售,AI是提效工具,技术探索相对聚焦零售协同场景[13] - **纵向专业化玩家**(如字节跳动、科大讯飞、百川智能)放弃全场景覆盖,试图在特定场景建立优势[13] - **字节跳动“小荷AI医生”**:通过抖音生态导流,功能侧重“健康咨询”、“报告解读”等医疗咨询能力,未设立独立购药服务端口[13] - **科大讯飞“晓医”**:C端产品体验偏向专业工具,其优势在于B/G端的“智医助理”产品经过大量基层医疗机构验证,临床数据积累深厚[14] - **百川智能“百小应”**:聚焦临床循证与科研支持,其医疗大模型Baichuan-M3主打问诊能力、治疗方案建议等专业功能,通过与卫健委、医院合作落地,技术精度高但面临B/G端落地周期长、缺乏C端流量的挑战[14][15] 为何成为大厂的必争之地 - **需求真实存在且持续增长**[17] - 优质医疗资源供需矛盾尖锐,AI成为系统性提效关键工具,有71%的中国临床医生开始依赖AI工具缓解工作压力[17] - 健康管理需求崛起,AI应用场景从“治病”延伸到“防病”,提供了更广阔的应用空间和用户互动频次[17] - **场景价值与用户粘性高**[18][20] - 根据2025年头豹研究院报告,AI+医疗核心应用场景集中在AI医疗器械、AI医疗助手等五大板块,其中AI医疗助手因较低的直接门槛、与用户高频互动的潜力,成为互联网大厂切入首选[18] - C端免费模式是培育市场的第一步,被视为撬动健康保险、药品研发、慢性病管理等产业链价值的入口,例如通过健康管理降低保险理赔率,或为药企提供研发服务[20] - **医疗是少数能深度串联G、B、C三端的垂直领域**[21] - **G端(政府)**:提供合规基础与高质量数据,参与相关项目有助于标准制定与获取合规数据训练权限[21] - **B端(机构)**:带来规模化收入,服务大型医院(尤其是百强三甲医院)是对产品的检验,也是打磨模型能力、形成核心壁垒的过程[21] - **C端(用户)**:是沉淀个性化数据、完成服务闭环的入口,千万级乃至亿级用户的健康数据与G、B端能力结合,可提供从健康建议到医保支付、药品配送的完整闭环服务[21] 数据、成本与责任,医疗AI的“三座大山” - **技术可靠性是首要挑战**:在医疗行业,AI模型的错误可能直接威胁生命,这决定了当前产品只能作为辅助工具,需要高昂的人力进行校验与审核[25] - **数据瓶颈制约模型发展**:医疗AI需要高质量、标准化与合规的训练数据,但核心医疗数据主要沉淀在公立医疗机构内部,受限于数据确权、隐私安全与共享机制,获取难度大、成本高[26] - **算力成本高昂**:涉及多模态数据的模型训练与推理需要巨大计算资源,且为满足医院数据安全要求,私有化部署成为主流,厂商需承担软硬件一体的巨额投入与长期维护成本[27] - **商业化路径依然模糊**:在基层医疗等重要赋能场景,存在付费意愿低、AI服务未纳入医保、产品同质化严重等问题,大厂的流量优势转化效果有限[29] - **责任认定存在模糊地带**:发生医疗损害时,责任在医疗机构、医生和AI提供商之间如何划分缺乏清晰法律界定,对大厂存在潜在的集体性追责风险与品牌声誉危机[30]
分级诊疗场景迎新机遇,医疗器械ETF(562600)蓄势调整,华兰股份逆势涨4.65%
搜狐财经· 2026-01-20 15:02
市场表现 - 1月20日A股市场震荡走弱,医疗器械ETF(562600)午后延续弱势,最终下跌1.52% [1] - 医疗器械ETF(562600)当日成交额达2686万元 [1] - 部分成分股逆势上涨,其中华兰股份上涨4.65%,海泰新光上涨1%,爱迪特、三友医疗等小幅上涨 [1] 行业动态与技术创新 - 百川智能发布新一代医疗增强大模型Baichuan-M3,在临床问诊、医疗幻觉抑制、HealthBench等权威评测中全面超越OpenAI最新旗舰模型GPT-5.2 [1] - Baichuan-M3成为首个在临床问诊、实验室检查和诊断三大维度同时排名第一的医疗AI模型,标志着医疗大模型的范式跃迁 [1] - 中信建投指出,医疗大模型正向临床决策可靠化迈进,有望加速AI在分级诊疗、辅助诊断等场景的商业化落地 [1] - 具备医疗数据积累与模型优化能力的企业将优先受益,AI+医疗赛道的成长确定性进一步增强 [1] 投资工具分析 - 医疗器械ETF(562600)跟踪中证全指医疗器械指数,可一键把握医疗器械行业成长机遇 [2] - 该指数中脑机接口概念占比达23.8%,在已上市同类ETF中含量最高,精准覆盖脑机接口核心标的 [2] - 指数中医疗器械行业占比高达89.2%,集中度突出,能有效捕捉细分赛道增长机遇 [2] - 该ETF重仓股包括迈瑞医疗、迪安诊断等行业龙头 [2] - 场外投资者可选择华夏中证全指医疗器械ETF发起式联接A(021250)和联接C(021251)进行便捷布局 [2]
阿里健康上线首个自研医学大模型;江中药业证券简称变为华润江中
21世纪经济报道· 2026-01-20 08:51
政策动向 - 市场监管总局批准发布《中医体质分类与判定》国家标准 该标准将于4月1日起正式实施 适用于医疗、公共卫生、科研、教学及健康产业全领域 [2] - 标准根据2009至2024年的最新研究结果 对平和质、气虚质等9种中医体质特征进行循证革新 并确定了标准化的体质辨识方法 [2] 药械审批 - 欧普康视(300595.SZ)的医疗器械产品“软性亲水接触镜”注册申请已获国家药监局受理 产品为境内Ⅲ类医疗器械 用于矫正屈光不正 [4] - 丽珠医药的注射用布瑞哌唑微球用于治疗精神分裂症的临床试验申请 已获国家药监局正式受理 [5] 资本市场 - 阿斯利康将收购西比曼生物GPC3装甲型CAR-T疗法C-CAR031在中国的剩余50%权益 并获得该疗法全球独家权益 西比曼生物将获得最高达6.3亿美元的款项 [7] - 奥泰生物(688606.SH)控股股东提议公司以超募资金回购股份 回购资金总额不低于1亿元 不超过2亿元 回购股份全部用于注销 [8] - 江中药业(600750.SH)公司名称已变更为“华润江中药业股份有限公司” 并拟将证券简称由“江中药业”变更为“华润江中” [12] 行业大事 - 阿里健康上线首个自研医学大模型“氢离子” 主要面向临床、科研领域的医生群体 标志着阿里在医疗健康领域实现了“C+D”端的完整AI布局 [10][11] - 京东健康面向医院全场景应用的大模型产品“京东卓医”已正式推出2.0版本 医疗AI赛道成为企业竞争焦点 [11] 舆情预警 - 何氏眼科股东先进制造产业投资基金计划减持公司股份不超过310.6074万股 占公司总股本的1.97% [14]
药易购(300937.SZ):与WiNGPT不存在任何关系,亦未与蚂蚁阿福在医疗AI领域开展合作
格隆汇· 2026-01-19 23:42
公司声明澄清 - 公司明确表示截至目前与WiNGPT不存在任何关系 [1] - 公司明确表示截至目前未与蚂蚁阿福在医疗AI领域开展合作 [1]