AntAngelMed（蚂蚁・安诊儿医疗大模型） - 财报，业绩电话会，研报，新闻

AntAngelMed（蚂蚁・安诊儿医疗大模型）

搜索文档

机器之心· 2026-01-09 10:53

AI医疗应用趋势 - 全球ChatGPT对话中超过5%与医疗健康相关，每天有4000万人向ChatAI寻求健康问题答案[3] - 用户主要使用AI探索症状（60%）和理解医学术语或临床建议（52%），越来越多的医生在撰写医疗报告时应用AI[3] - OpenAI已发布ChatGPT健康，整合个人健康信息与大模型能力以辅助健康决策[3] 蚂蚁安诊儿医疗大模型(AntAngelMed)概述 - 模型由蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司开源[4] - 总参数量达到1000亿，激活参数为61亿，是迄今为止参数量最大的开源医疗领域专业模型[5] - 在HealthBench、MedAIBench等权威评测中表现超过GPT-oss、Qwen3、DeepSeek-R1等通用模型及现有医疗增强推理模型，达到开源模型第一[5] - 在MedBench中国医疗健康领域LLM权威基准中位列第一，综合得分68.0[7][8] 模型技术架构与训练 - 采用专业三阶段训练流程构建医学能力[12] - 第一阶段为持续预训练，在蚂蚁百灵通用基座模型Ling-flash-2.0-base上引入大规模高质量医学语料以构建完整医学知识结构[13][14][15] - 第二阶段为监督微调，引入高质量医疗指令数据，重点微调模型推理过程表达，使其在真实场景中能更好理解语境并给出符合医疗逻辑的回应[16][17] - 第三阶段为强化学习，采用GRPO算法，通过推理强化学习和通用强化学习双阶段路径，优化模型因果推理清晰度并控制行为边界与风险意识[18][19][20][21][22] 模型性能与效率 - 采用高效混合专家架构，仅激活1/32参数（61亿），相比同等规模Dense架构可实现高达7倍的效率提升[26][29][30] - 仅需6.1B激活参数即能实现约40B稠密模型的性能，资源占用更低、可扩展性更强[30] - 在H20硬件环境下推理速度超过200 tokens/s，约为36B稠密模型的3倍，适合高并发医疗场景[31] - 采用YaRN外推技术将上下文长度扩展至128K，增强处理长病历文档能力[33] - 采用FP8量化结合EAGLE3优化方案，在并发数为32时显著提升推理吞吐量，在HumanEval、GSM8K和Math-500数据集上提升幅度分别为71%、45%和94%[34] 行业影响与展望 - 模型开源将极大降低前沿医疗AI技术应用门槛，使大量机构和研究者可进行下游任务微调[44] - 蚂蚁集团将依托国家平台持续推进“AI+医疗”开源生态与技术创新，普惠更多开发者与用户[45]

医疗大模型

AI+医疗

人工智能

AntAngelMed（蚂蚁・安诊儿医疗大模型）

AntAngelMed（蚂蚁・安诊儿医疗大模型）

ChatGPT