医疗AI
搜索文档
决定赛道的并非“爆款”
深圳商报· 2026-01-02 05:52
行业商业化阶段转变 - 医疗AI行业正从“验证价值”阶段进入商业化新阶段,标志性变化是出现了真正的“买单方”且出手不凡 [1] - 商业化模式正从“医院试点买单”走向“体系级采购” [1] - 上亿元级别政府订单的出现,被视为医疗AI商业化的“第一道闸门”被打开 [1] 近期重大订单与采购方 - 过去一个月内,科大讯飞、支付宝、百度先后中标上亿元级别的政府医疗项目 [1] - 当前阶段,医疗AI最清晰的付费方是政府与公立医疗体系 [1] 订单性质与商业模式 - 近期中标的三笔订单,指向的并非单一医院或具体应用,而是医疗AI的底层平台与基础能力建设 [1] - 当前商业模式的核心逻辑是公共投入与能力建设,而非市场化回报 [1] - 真正跑通的商业模式是“基础设施模式”,而非“爆款产品模式” [1] 不同市场层面的发展状况 - 在C端与市场化层面,医疗AI仍处于“慢变量”阶段 [1] - 面向用户的健康管理智能体与面向医生的辅助决策工具,其商业价值更多体现在降低系统成本、提升服务效率,而非直接创造新增收入 [1] 未来关键与行业格局 - 行业未来将从“平台建设期”进入“深度使用期” [1] - 决定赛道最终格局的关键在于,AI能否在真实医疗场景中持续创造可衡量的价值 [1]
AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品
量子位· 2025-12-29 14:37
文章核心观点 - 蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个大模型专病循证能力评测框架GAPS及其配套评测集GAPS-NSCLC-preview,旨在解决现有医疗AI评测缺乏临床深度、完整性、鲁棒性与安全性综合评估的问题 [1][2] - 该研究通过客观评测发现,当前主流医疗大模型虽具备广泛医学知识,但在应对真实临床场景的不确定性时,其判断力与可靠性仍需提升,尚处于“背书机器”而非“推理伙伴”的阶段 [3][29][40] - GAPS框架标志着医疗AI评测标准从“考试分数”向“临床胜任力”的范式转移,为AI向可信临床伙伴演进提供了系统性、自动化、可扩展的评估工具,是医疗AI从“技术驱动”走向“临床价值驱动”的关键一步 [16][39][40] 行业痛点与现有评测局限 - 行业面临“考得好,信不过”的困境,医生和患者难以在短时间内对大模型产生客观评价,信任无从建立 [5] - 当前医疗AI的基准测试(如MedQA、PubMedQA)普遍依赖“试卷型”基准,仅考察事实记忆能力,而HealthBench等方法则受限于主观性强、扩展性差 [7] - 现有方法无法反映真实诊疗场景中患者描述模糊、检查结果矛盾、治疗方案需权衡利弊等不确定性挑战,真正的医疗能力在于管理不确定性而非背诵事实 [8] - 尤其在肺癌这一全球致死率最高的癌症领域,缺乏细粒度、专病化的评估工具,使得行业难以客观判断医疗AI的临床可用性 [9] GAPS评测框架的核心设计 - GAPS是一个基于循证医学、全自动构建的AI临床能力评测框架,首次将临床胜任力解构为四个正交维度:认知深度(G)、回答完备性(A)、鲁棒性(P)和安全底线(S) [11][16] - **认知深度(G)**:分为四级,从G1(事实回忆)到G4(在证据冲突或缺失的“灰色地带”进行推理性思维),其中G4是当前所有模型的“死亡区” [11][14] - **回答完备性(A)**:引入三级评价,A1(核心诊疗建议)、A2(关键限定条件,如剂量、禁忌症)、A3(患者教育等),缺少A2可能导致临床误用 [12][14] - **鲁棒性(P)**:通过三类扰动测试模型抗干扰能力,包括语言噪音(P1)、冗余信息(P2)和对抗性前提(P3),实验显示多数模型极易被误导 [13][14][15] - **安全底线(S)**:建立四级风险体系,从S1(无关回答)到S4(灾难性错误),一旦触犯S4,总分直接归零,是不可逾越的红线 [16] 技术实现与核心优势 - **全自动化流水线**:GAPS构建了一套基于临床指南的自动化生成工厂,实现了从问题生成、评分标准制定到多维度打分的端到端自动化 [2][17] - **评测集详情**:已成功应用于非小细胞肺癌(NSCLC)领域,生成包含92个问题、覆盖1691个临床要点的评测集GAPS-NSCLC-preview,每题均配备平均12项完整性与7项安全性评分要点 [2][18] - **关键流程**:包括证据邻域构建、基于GRADE方法学的Deep Research Agent模拟专家流程、以及利用大模型合成去隐私化临床病例的虚拟患者生成 [20] - **可扩展性**:未来可快速扩展至心血管、儿科、内分泌等任意专科的专病领域,只要有指南就能生成高质量评测集 [19] - **自动化评测框架**:配套的自动化评测框架实现了客观、细粒度、端到端的评估,其评分结果与五位资深专家独立标注的整体一致率达90.00%,Cohen‘s Kappa系数达0.77,Macro-F1达0.88,已达到人类专家间一致性水平(88.5%~92.0%) [23][24][25] - **结构化反馈**:框架输出的结构化评分(G/A/P/S四维)可精准定位模型缺陷,使GAPS成为“评测即反馈、反馈即迭代”的基石,推动AI医疗能力通过可量化指标稳步进化 [26] 对主流大模型的评测结果 - **认知深度表现悬殊**:所有模型在G1(事实)和G2(解释)阶段表现优异(GPT-5得分约0.72),但进入G3(确定性决策)和G4(非确定性推理)后分数断崖式下跌,GPT-5在G4阶段跌至0.45,其他模型甚至跌破0.35 [29] - **回答完备性不足**:在完备性测试中,模型往往只给出核心建议(A1),却忽略了关键的限定条件(A2),导致临床建议缺乏可操作性 [31] - **鲁棒性脆弱**:在P3(对抗性测试)中,只要在提问中加入误导性前提,模型的判断力就会崩塌,甚至顺从用户的错误引导 [34] - **安全隐患**:在复杂的推理场景下,部分模型(如Claude Opus 4)的致命错误率(S4)随难度显著上升,尽管GPT-5和Gemini 2.5在极高风险错误上控制较好 [36] 合作模式与行业意义 - **权威临床主导**:项目由北京大学人民医院王俊院士团队全程主导,原创性提出GAPS评测理论框架,并组织十余位胸外科医生深度参与题库构建、金标准答案撰写及专业审核,确保指标扎根真实临床实践 [4] - **医工深度融合**:实现了“临床专家定标准、AI技术做转化”的协作模式,突破了传统医疗AI评测中专家浅层参与的局限,为医疗AI发展树立了新的范式 [4] - **公开成果**:相关论文、评测集GAPS-NSCLC-preview及自动化评测框架已全面公开,可供行业研究与应用 [2][41]
我们走访全国百强三甲医院,发现40%都选了同一家AI公司
量子位· 2025-12-23 11:01
行业背景与挑战 - 通用型大模型在医疗场景中存在高幻觉率问题,回答医疗相关问题时胡说八道的概率高达40%[4] - 患者使用通用Chatbot自查后与医生对线,打乱诊疗节奏,增加了医患沟通成本[1][2][3] - 医疗决策具有连续性且错误成本极高,医院对AI的幻觉和错误容忍度接近于零,这使得医疗AI落地门槛极高[13][14][15][18] 医疗AI的竞争焦点与分水岭 - 医疗AI竞争从能力展示转向真实运行,能否在三甲医院长期稳定运行并实现可复盘效果成为关键分水岭[10] - 成功的医疗AI公司需依靠长期场景积累、工程化交付能力及可复盘的落地效果[7] - 大量能力强的模型停留在评测榜单,难以在现实世界规模推广[19] 云知声的市场地位与部署规模 - 在全国百强三甲医院中,约40%选择了云知声的医疗AI解决方案[9] - 截至今年6月,云知声智慧医疗解决方案已在全国部署400家医院,另有700余家进入测试阶段[22] - 其门诊病历生成系统生成的病历,直接引用率接近90%,即每10份中约有9份医生可一字不改直接使用[23][24] - 系统已覆盖除外科外的医院全科室场景[59] 云知声的产品效能与客户反馈 - 病历生成系统为北京多位三甲医院医生节省了近九成的时间成本[25] - 系统在生成速度与准确率之间保持稳定平衡,能自然嵌入医生工作流[58] - 客户价值显著提升,每个医疗客户收入(客单价)从2024年同期的46.9万元大幅增长至101.3万元,增幅达116.2%[67] 云知声的技术与模型演进 - 公司自2016年起布局智慧医疗,演进与中国医疗信息化进程高度同步[30][31] - 基于自研医疗大模型“山海大模型”,能力覆盖病历语音输入、质控、医保支付管理及医学知识图谱等[27] - 最新发布的山海·知医 5.0采用“医学文本大模型+医学多模态大模型”双核心体系,能处理结构化信息、文本、影像等多源输入[34][35] - 创新提出“结构化图谱—半结构化文档—过程化轨迹”三层金字塔数据范式,以降低模型幻觉[37][41] - 通过后训练技术将特定医疗任务下的幻觉率压降至3%以内[42] 技术评测表现 - 在MedBench 4.0评测中,云知声UniGPT-Med系列模型在大语言模型、多模态大模型、智能体三个榜单均位列第一[46][47] - SuperCLUE报告显示,山海大模型在医疗领域评测表现超越了GPT-4[45] 商业化进展与财务表现 - 医疗业务表现突出,2025中期报告显示该业务收入达0.70亿人民币,同比增长22.3%,占总收入17.3%[66] - 业务增长具备可见性,公司对2026年的增速判断明显高于2025年[76] - 产品通过标准化形态交付,支持跨院复制,增长路径清晰可持续[62][63] 公司发展态势与外部环境 - 公司于今年6月30日在港股上市,上市公司身份为医院决策提供了重要信任背书[70][72] - 政策层面支持医疗AI应用场景创新,国务院办公厅发文要求加快高价值应用场景培育和开放[78][79][80] - 资本市场开始为“医疗AI进入临床工作流”定价,2025年美国新晋AI独角兽有55%来自医疗AI赛道[82] - 海外对标公司OpenEvidence(旨在打造医生专用ChatGPT)估值在短期内从10亿美元飙升至120亿美元[83]
云知声(09678)发布医疗领域专家大模型“山海?知医大模型5.0”版本
智通财经· 2025-12-22 12:27
核心观点 - 云知声发布了其医疗领域专家大模型“山海·知医大模型5.0”版本,构建了双核心产品体系,旨在打造业界能力维度最丰富的医疗AI技术支撑体系之一,并已在权威评测中取得领先地位及在三甲医院实现规模化应用 [1][2][3] 产品与技术发布 - 公司发布医疗领域专家大模型“山海·知医大模型5.0”版本,构建“医学文本大模型+医学多模态大模型”双核心产品体系 [1][2] - 该大模型全面覆盖文本处理、智能体协同、多模态感知等核心能力,整合医学知识问答、临床任务规划、影像解析等多元功能 [2] - 医疗大模型能够深度模拟临床思维进行复杂推理,实现精准鉴别诊断与循证决策 [2] - 公司依托海量优质医疗数据与专属知识库训练,在医学知识问答、信息抽取等核心任务中达到业界顶尖水平 [2] - 通过持续课程学习、知识图谱增强及循证对齐训练,最大限度降低医疗幻觉,确保输出内容的真实性与可验证性 [2] 行业评测与认可 - 2025年12月,在上海人工智能研究院的MedBench 4.0评测中,公司在医疗智能体、大语言模型和多模态大模型中分别取得94.6分、65.7分、59.6分的成绩,包揽了医疗大模型全部三项技术范式第一 [3] - 在国家人工智能应用中试基地(医疗)·浙江发布的《MedAIBench测评榜(优秀国产医疗大模型)》中,公司医疗大模型荣耀登榜 [3] 市场应用与落地 - 公司医疗大模型已在众多三甲医院实现规模化落地应用 [3] - 在临床辅助诊疗等专业要求极高的场景与三甲医院合作完成技术验证,其技术能力与医疗行业规范、临床实际需求深度适配 [3]
云知声(09678)发布医疗领域专家大模型“山海‧知医大模型5.0”版本
智通财经网· 2025-12-22 12:13
公司产品发布与技术升级 - 公司发布医疗领域专家大模型“山海‧知医大模型5.0”版本,构建“医学文本大模型+医学多模态大模型”双核心产品体系 [1] - 该模型全面覆盖文本处理、智能体协同、多模态感知等核心能力,整合医学知识问答、临床任务规划、影像解析等多元功能 [1] - 该模型能够深度模拟临床思维进行复杂推理,实现精准鉴别诊断与循证决策 [1] - 公司依托海量优质医疗数据与专属知识库训练,在医学知识问答、信息抽取等核心任务中达到业界顶尖水平 [1] - 通过持续课程学习、知识图谱增强及循证对齐训练,最大限度降低医疗幻觉,确保输出内容的真实性与可验证性 [1] 行业评测表现与认可 - 2025年12月,在上海人工智能研究院的MedBench 4.0评测中,公司在医疗智能体、大语言模型和多模态大模型中分别取得94.6分、65.7分、59.6分的优异成绩 [2] - 公司在上述评测中一举包揽了医疗大模型全部三项技术范式第一 [2] - 在国家人工智能应用中试基地(医疗)‧浙江发布的《MedAIBench测评榜(优秀国产医疗大模型)》中,公司医疗大模型荣耀登榜 [2] 商业化落地与应用验证 - 公司医疗大模型已在众多三甲医院实现规模化落地应用 [2] - 该模型在临床辅助诊疗等专业要求极高的场景与三甲医院合作完成技术验证 [2] - 其技术能力与医疗行业规范、临床实际需求深度适配,彰显临床实用价值与行业适配性 [2]
云知声发布医疗领域专家大模型“山海 知医大模型5.0”版本
智通财经· 2025-12-22 12:12
公司产品发布与技术进展 - 云知声发布医疗领域专家大模型“山海知医大模型5.0”版本,构建“医学文本大模型+医学多模态大模型”双核心产品体系 [1] - 该模型全面覆盖文本处理、智能体协同、多模态感知等核心能力,整合医学知识问答、临床任务规划、影像解析等多元功能,形成当前业界能力维度最丰富的医疗AI技术支撑体系之一 [1] - 医疗大模型能够深度模拟临床思维进行复杂推理,实现精准鉴别诊断与循证决策 [1] - 公司依托海量优质医疗数据与专属知识库训练,在医学知识问答、信息抽取等核心任务中达到业界顶尖水平 [1] - 通过持续课程学习、知识图谱增强及循证对齐训练,最大限度降低医疗幻觉,确保输出内容的真实性与可验证性 [1] 行业评测表现与认可 - 2025年12月,在上海人工智能研究院的MedBench4.0评测中,公司在医疗智能体、大语言模型和多模态大模型中分别取得94.6分、65.7分、59.6分的优异成绩 [2] - 公司在上述评测中一举包揽了医疗大模型全部三项技术范式第一 [2] - 在国家人工智能应用中试基地(医疗)浙江发布的《MedAIBench测评榜(优秀国产医疗大模型)》中,公司医疗大模型荣耀登榜 [2] 市场应用与落地情况 - 公司医疗大模型已在众多三甲医院实现规模化落地应用 [2] - 该模型在临床辅助诊疗等专业要求极高的场景与三甲医院合作完成技术验证 [2] - 其技术能力与医疗行业规范、临床实际需求深度适配,充分彰显其临床实用价值与行业适配性 [2]
云知声(09678) - 自愿性公告 - 最新技术进展
2025-12-22 12:02
新产品和新技术研发 - 公司发布医疗领域专家大模型“山海‧知医大模型5.0”版本,构建双核心产品体系[3] 技术成果 - 2025年12月在MedBench 4.0中,三项技术范式包揽第一,得分分别为94.6分、65.7分、59.6分[4] - 医疗大模型登上《MedAIBench测评榜(优秀国产医疗大模型)》[4] 市场应用 - 医疗大模型在众多三甲医院规模化落地应用并完成技术验证[4]
中泰国际每日晨讯-20251222
中泰国际· 2025-12-22 10:45
港股市场表现 - 恒生指数、国企股指数、恒生科技指数上周五分别上涨0.8%、0.7%、1.1%[1] - 恒生医疗保健指数上周下跌1.8%,但后半周回升,其中周五上涨1.7%[5] 行业与板块动态 - 美国2026财年国防授权法案未点名中国CXO公司,医药行业忧虑舒缓,药明生物与药明康德股价回升[1][2] - 国务院办公厅印发意见加强电子烟全链条监管,市场认为将净化市场并带来合规化发展机遇[1] - 小鹏汽车在广州获得L3级自动驾驶路测牌照,股价上周五上涨7.6%[4] - 光伏行业获工信部表态将加强产能调控,以加快实现动态平衡[6] - 新能源及公用事业港股上周普遍下跌,但光伏板块轻微上升,环保及香港公用事业板块获防守性买盘支持[6] 公司动态与新股 - 医疗AI公司英矽智能正在招股,其股东净亏损从2022年的2.2亿美元缩减至2024年的1709.6万美元[5] - 字节跳动与甲骨文等成立美国合资公司以运营TikTok美国业务,甲骨文股价上涨[2] - 美光科技公布优异的第一财季业绩后,股价上涨[2] 宏观与市场观点 - 美国12月密歇根消费者信心指数为52.9,低于预测的53.5,但高于前值51.0[3] - 短期内港股或受益于外围气氛好转,但圣诞节前预计维持窄幅波动[2] - 近期美元偏弱,国际金价与铜价强势,有色金属板块龙头或短期受益[2]
日均调用近千次 医渡科技(02158)AI临床助手这样提升专科诊疗效率
智通财经网· 2025-12-19 11:53
行业核心挑战与公司战略定位 - 医疗AI行业面临的核心挑战是通用大模型难以满足临床严谨性需求,存在“幻觉”风险、过程不透明及缺乏医疗严谨性等问题,从“可用”走向“实用”是关键关卡 [1] - 医渡科技的解题思路是进行系统性重构,致力于让AI的思考过程变得可控、可信、可溯源 [6] - 公司以自研医疗垂域大模型“YiduCore”为核心,打造“大数据+大模型”双中台解决方案,旨在为医院构建高质量发展的数字底座 [6] 核心技术平台与能力构建 - 公司AI中台的核心价值在于将大模型能力系统性转化为符合医疗规范、理解临床流程、知晓专科知识的“智能体”,以实现AI在医院场景中的落地生根 [6] - AI中台通过三大核心能力筑牢信任基石:内置高质量“知识中心”为AI提供专业知识支撑;集成40+智能算子支撑流程透明可追溯;以轻量无缝方式嵌入自然工作流实现“即想即用” [7] - 基于AI中台,公司构建了覆盖病历生成、辅助诊疗、风险评估、患者教育等全链条的130+个场景智能体,深度结合临床工作流 [7] 具体产品应用与临床实践 - 公司推出“医生临床Copilot”,以轻量级插件形态嵌入医生工作站,深度融入病历书写、治疗方案制定等核心场景,旨在破解医疗AI落地临床的难题 [7] - 在心内科领域,构建的心内科专科指南助手集成20+心血管专业指南共识,可通过自然语言交互实时分析患者数据,为急诊等场景提供决策支持 [8] - 在肿瘤领域,针对“肿瘤TNM分期”任务,通过嵌入多版指南与知识图谱,智能体将评估准确率提升至90%的主任医师水平,同时降低对算力的要求 [8] 合作案例与实施成效 - 与武汉同济医院共建专科数字名医,打造胸部肿瘤专家的数字分身,可自动接入患者数据提供个性化咨询,融合20+权威指南与专家经验,并以数字人技术提供7×24小时专业咨询 [8] - 在中山大学肿瘤防治中心的实践中,临床Copilot日均调用达800-1000次,助力单病种数据上报效率提升95%、肿瘤分期完成率提升5%+,并推动科研效率提升90%、支撑超3000个科研项目 [9] - 实践表明,AI已从“尝鲜新工具”转变为医生信赖依赖的“数字同事” [9] 行业趋势与公司展望 - 医疗AI行业正转向“专业协作”的垂直场景能力,深度适配临床流程与医生思维,经历从“外部工具”到“内生能力”的跨越 [9] - 公司未来将依托“双中台”解决方案与“智能体”矩阵,在更多专科领域持续深耕,以大模型临床助手为支点,推动医疗服务体系向更精准、高效的方向迈进 [9]
涨停复盘:今日全市共61股涨停,连板股总数17只,银行板块震荡拉升,医药商业延续强势
搜狐财经· 2025-12-18 18:48
市场整体表现 - 12月18日A股三大股指走势分化 沪指涨0.16%报3876.37点 深成指跌1.29%报13053.97点 创业板指跌2.17%报3107.06点 科创50指数跌1.46%报1305.97点 [1] - 沪深两市成交额1.66万亿元 全市场近2900只个股上涨 [1] - 全市场共61股涨停 连板股总数17只 19股封板未遂 封板率为76% [1] 板块异动 - 银行板块震荡拉升 上海银行涨超3% [1] - 零售概念走强 中央商场 上海九百涨停 [1] - 商业航天概念走势活跃 盛洋科技2连板 顺灏股份涨停 [1] - 医药商业延续强势 鹭燕医药2连板 重药控股7天4板 [1] - IP经济概念表现活跃 广博股份 三湘印象涨停 [1] 涨停个股分析 - 消费板块多股涨停 包括百大集团 皮阿诺 利群股份 嘉美包装 南京商旅 庄园牧场 来伊份 中央商场 浪莎股份 深中华A 上海九百 皇氏集团 九牧王 众兴菌业 爱丽家居 瑞贝卡 华资实业 益民集团 新世界 法狮龙 博纳影业 [8] - IP经济板块涨停个股包括广博股份 三湘印象 德艺文创 [8] - 医疗医药板块涨停个股包括鹭燕医药 重药控股 华人健康 塞力医疗 美年健康 英特集团 豪悦护理 嘉和美康 一心堂 漱玉平民 [8][9] - 商业航天板块涨停个股包括盛洋科技 钧达股份 神剑股份 顺灏股份 天箭科技 北摩高科 华体科技 西部材料 [9] - 智能驾驶板块涨停个股包括浙江世宝 威帝股份 兴民智通 [9] - 其他热点及个股涨停包括立达信 中国武夷 长飞光纤 瑞斯康达 东兴证券 胜通能源 万隆光电 奥普光电 博菲电气 苏利股份 浙江众成 乐通股份 中天服务 新通联 [9] 相关热点事件 - 健康垂类AI应用异军突起 蚂蚁集团推出的AI健康应用更名为“蚂蚁阿福” 月活用户数已突破1500万 [10] - 预计2024年至2032年 全球医疗AI市场将以43%的年复合增长率攀升 市场规模有望达到4910亿美元 [10]