Workflow
润医医疗大模型
icon
搜索文档
盘古大模型加持,润医医疗大模型在MedBench评测中再获双料冠军
雷峰网· 2025-06-23 19:11
盘古大模型与润医医疗大模型的技术突破 - 盘古大模型作为通用AI底座与润医医疗大模型结合,树立了AI+医疗行业新标杆 [1] - 润医医疗大模型基于盘古L0层,使用千亿级医学文献、指南及千万量级医疗档案训练,显著提升医学知识储备与专业表达能力 [8] - 提出多智能体医学数据合成工作流自演进技术,通过生成/反思智能体优化数据质量,实现高阶认知技能如推理、诊断的突破 [9] MedBench评测表现 - 润医医疗大模型在2025年6月MedBench评测中双榜登顶:专业榜单综合得分96.4分,自测榜单93.2分 [3][4] - 专业榜单细分能力:医学知识问答87.7分、复杂医学推理84.8分、医学语言理解122.4分、医疗安全伦理98.7分 [2][4] - 自测榜单细分能力:医学知识问答91.2分、医学语言生成85.1分、医学语言理解123.1分、医疗安全伦理106.6分 [3][4] 行业影响与认可 - 在2025华为开发者大会上,华为云CEO张平安高度评价润医医疗大模型的技术突破,引用MedBench结果肯定其行业领先地位 [7] - MedBench作为中文医疗大模型权威评测平台,已累计评测全球百余个模型,覆盖五大核心能力维度 [7] - 盘古医疗垂域模型被定位为医疗行业智能化转型的关键引擎,将推动服务质量、效率与可及性变革 [10] 技术方法论创新 - 数据合成工作流自演进技术通过记忆模块保存优化路径,实现持续迭代,生成逻辑清晰的高质量训练数据 [9] - 技术突破使模型具备诊断、表达等认知技能,成为懂医学、会思考的垂域专家级模型 [9] - 昇腾体系支撑大模型高效运行,相关技术如"数字化风洞"、算芯合一设计细节被同步披露 [12][14]
MedBench最新榜单出炉!深兰科技医疗大模型综合测评第一
证券日报· 2025-05-28 22:14
医疗大模型评测 - 深兰科技DeepBlue-MR-v1医疗大模型以94.2的高分在MedBench多个综合评测中排名第一 [1] - 该模型在复杂医学推理评测中持续霸榜并扩大领先优势 [1][2] - MedBench评测平台由上海人工智能实验室与上海市数字医学创新中心联合多家机构设立 已评测全球超过387个模型 [1] 技术能力与研发 - DeepBlue-MR-v1基于Transformer架构 通过海量医学数据预训练构建医学推理语义空间 [2] - 模型采用自研训练体系 包括监督微调 指令增强和多阶段自适应强化学习算法 [2] - 在医学语言理解 生成 知识问答 复杂推理 安全伦理五个维度综合得分领先 [2] 产品应用与商业化 - 基于DeepBlue-MR-v1开发的AI医疗产品包括问诊助手 远程视频问诊 辅助诊断系统等 [3] - 已与武汉市中心医院 协和医院等多家医疗机构达成合作 [3] - 合作重点为问诊 诊断和专科服务等场景的AI技术深度应用 [3]