Workflow
AntAngelMed(蚂蚁・安诊儿医疗大模型)
icon
搜索文档
医疗领域DeepSeek时刻:蚂蚁 · 安诊儿医疗大模型正式开源,登顶权威榜单
机器之心· 2026-01-09 10:53
AI医疗应用趋势 - 全球ChatGPT对话中超过5%与医疗健康相关,每天有4000万人向ChatAI寻求健康问题答案[3] - 用户主要使用AI探索症状(60%)和理解医学术语或临床建议(52%),越来越多的医生在撰写医疗报告时应用AI[3] - OpenAI已发布ChatGPT健康,整合个人健康信息与大模型能力以辅助健康决策[3] 蚂蚁安诊儿医疗大模型(AntAngelMed)概述 - 模型由蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司开源[4] - 总参数量达到1000亿,激活参数为61亿,是迄今为止参数量最大的开源医疗领域专业模型[5] - 在HealthBench、MedAIBench等权威评测中表现超过GPT-oss、Qwen3、DeepSeek-R1等通用模型及现有医疗增强推理模型,达到开源模型第一[5] - 在MedBench中国医疗健康领域LLM权威基准中位列第一,综合得分68.0[7][8] 模型技术架构与训练 - 采用专业三阶段训练流程构建医学能力[12] - 第一阶段为持续预训练,在蚂蚁百灵通用基座模型Ling-flash-2.0-base上引入大规模高质量医学语料以构建完整医学知识结构[13][14][15] - 第二阶段为监督微调,引入高质量医疗指令数据,重点微调模型推理过程表达,使其在真实场景中能更好理解语境并给出符合医疗逻辑的回应[16][17] - 第三阶段为强化学习,采用GRPO算法,通过推理强化学习和通用强化学习双阶段路径,优化模型因果推理清晰度并控制行为边界与风险意识[18][19][20][21][22] 模型性能与效率 - 采用高效混合专家架构,仅激活1/32参数(61亿),相比同等规模Dense架构可实现高达7倍的效率提升[26][29][30] - 仅需6.1B激活参数即能实现约40B稠密模型的性能,资源占用更低、可扩展性更强[30] - 在H20硬件环境下推理速度超过200 tokens/s,约为36B稠密模型的3倍,适合高并发医疗场景[31] - 采用YaRN外推技术将上下文长度扩展至128K,增强处理长病历文档能力[33] - 采用FP8量化结合EAGLE3优化方案,在并发数为32时显著提升推理吞吐量,在HumanEval、GSM8K和Math-500数据集上提升幅度分别为71%、45%和94%[34] 行业影响与展望 - 模型开源将极大降低前沿医疗AI技术应用门槛,使大量机构和研究者可进行下游任务微调[44] - 蚂蚁集团将依托国家平台持续推进“AI+医疗”开源生态与技术创新,普惠更多开发者与用户[45]