MedBench 4.0
搜索文档
微医医疗大模型领跑MedBench 4.0综合榜单
环球网· 2026-01-13 12:31
行业评测平台与标准 - 中文医疗大模型权威评测平台MedBench发布了最新4.0版本评测结果 [1] - MedBench 4.0是国内首个且唯一面向医疗垂直大模型、专用大模型及应用场景的综合性评测与验证平台 [1] - 平台对齐国家《卫生健康行业人工智能应用场景参考指引》 覆盖60个全自主构建评测集 深度提炼共70万余专业评测题 [2] - 评测体系聚焦“实战化评测突破”与“生态化开放共建”两大核心方向 包含多模态大模型、大语言模型及智能体三大技术范式 [2] - 此次升级标志着我国医疗大模型评测体系迈入一个全新的阶段 [2] 公司评测表现与排名 - 在MedBench 4.0的综合榜单中 微医医疗大模型持续领跑 [1] - 在多模态大模型评测榜单中 微医医疗大模型排名第一 综合得分为60.8 [2] - 在大语言模型和智能体的评测方面 微医医疗大模型均位列榜单前三 [3] - 评测结果验证了公司突出的临床辅助能力与可靠性 [1] 公司技术能力与特点 - 微医医疗大模型在多模态能力上问鼎榜单 [3] - 其能力在医学影像辅助分析、多模态报告解读等方面获得精准验证 MedBench 4.0为此设置了涵盖目标检测、图像分类等10项细分任务 [3] - 公司自研技术聚焦深度融合临床真实诊疗数据与临床决策路径 [3] - 与满足日常健康咨询的通用大模型不同 该模型在需要专业判断的严肃医疗场景中能够提供高质量的循证参考 [3] - 公司技术发展遵循“生于场景、长于场景”的路径 训练与优化始终与线下医疗机构的真实业务流程紧密耦合 [3][4] - 在真实业务场景协同下 公司已形成能够增强训练和自我强化的数据飞轮效应 在疗效评估、经济性评估等反馈中不断优化AI医疗能力 [4] 公司业务应用与战略 - 微医医疗大模型的能力已全面赋能微医人工智能医院的各项服务 [4] - 大模型能力通过AI医生、AI药师、AI健管、AI智控和微小医等五大智能体 已在AI健共体中规模化应用 实现了从技术能力到商业价值的闭环转化 [4] - 公司表示将以通过权威验证的医疗大模型为核心驱动 联合生态伙伴在更广泛的医疗人工智能应用领域持续深耕 [4] - 公司目标是构建一个智能化、普惠化的医疗健康新生态 让优质医疗资源触手可及 [4] - 模型的核心价值在于真正赋能诊疗水平提升、助力基层医疗补短 最终服务于价值医疗的宏伟目标 [3]