MedBench多模态医疗大模型评测结果 - MedBench平台于2026年2月7日公布最新多模态大模型评测榜单,数坤科技的数坤坤多模态医学大模型V3以63.6分的综合得分位列第一 [1][3] - V3的表现超越了微医医疗大模型(60.8分)、云知声的UniGPT-Med-VL(59.6分),以及OpenAI的GPT-5-chat-latest(53.7分)、谷歌的Gemini-2.5-Pro(51.9分)和阿里巴巴的Qwen2.5-vl-72b-instruct(48.6分)等国内外通用及垂直领域模型 [2][3][9] 数坤科技V3模型核心优势 - V3模型参数规模为72B,在评测的三大细分指标中,其在“医疗视觉感知与文本提取”(73.4分)和“跨模态语义理解与推理”(51.1分)两项均排名第一,在“临床决策支持与推理”(66.4分)中排名第二,仅次于微医医疗大模型(71.2分)[3][8] - 模型性能提升得益于公司积累的PB级医疗专业数据,以及采用的“医学MDT(多学科会诊)式训练策略”,该策略模拟医生真实诊疗过程,对同一病种的多模态信息进行深度关联学习 [4][11][12] - 公司团队拥有大量具备医学背景的研发人员,能够深入理解不同医学数据(如CT影像与病理报告)之间的关联,这支撑了模型在复杂真实任务(如鉴别诊断、个体化治疗)上的表现 [5][16] 数坤科技在AI医疗领域的积累与市场地位 - 公司成立于2017年,深耕医疗领域8年,已陆续推出超100款数字医生产品组合,产品在超过5000家公立医院和超1000家体检机构日常使用,覆盖了90%的Top 100医院和目标公立三甲医院 [3][17] - 公司是全球首创“数字人体技术平台”的企业,也是国内唯一覆盖影像全模态的AI企业,其技术已渗透到放射、超声、手术等领域 [14] - 公司不仅是业内首个将三维神经网络用于医学图像处理的企业,也是最早从心脏领域切入并实现技术突破的医疗AI公司 [17] 医疗大模型行业发展趋势与竞争壁垒 - MedBench评测体系由上海AI实验室发起,其4.0版本被称为全国首个且唯一面向垂直模型、专业模型和应用场景的医疗大模型评测与验证体系 [5] - 医疗大模型的核心竞争力正从单纯的参数规模与训练算力,转向对真实医疗场景的理解和高质量专业数据的积累 [18] - 医疗大模型应用门槛高,需要医学与AI知识的双重积累,并对模型输出的准确性(减少幻觉)有极高要求,这构成了行业的重要竞争壁垒 [15][16]
国产医疗大模型登顶权威榜单,核心秘籍:PB级训练数据、模拟医生真实会诊过程
36氪·2026-02-13 20:06