Workflow
医学推理数据生成
icon
搜索文档
达摩院推出多智能体框架ReasonMed,打造医学推理数据生成新范式
机器之心· 2025-11-03 12:04
缺乏有效性验证: 缺乏系统性实验来对比「详细解说诊断思维」与「直接给出结论」两种训练策略的优劣。 因此,我们亟需探索更科学的方法,为模型注入权威医学知识、扩展其知识边界,并生成更严谨、高质量的多步推理路径。针对上述挑战,ReasonMed 提 出一套完整的医疗推理数据生成解决方案: 多源知识的整合: 从四个权威医学问答基准(MedQA、MMLU、PubMedQA、MedMCQA)汇聚约 19.5 万医学问题,覆盖广泛的专业知识面。 多模型的数据构建: 通过引入多个专有模型,共同生成并验证医疗推理路径,多模型互补与交叉验证提升了知识覆盖与逻辑一致性,更好的构建规模化且 高质量的医学推理数据。 本文第一作者是阿里巴巴达摩院研究实习生孙雨,他的主要研究兴趣方向是Medical Reasoning LM。本文通讯作者是阿里巴巴达摩院资深专家徐挺洋博 士。 在人工智能领域,推理语言模型(RLM)虽然在数学与编程任务中已展现出色性能,但在像医学这样高度依赖专业知识的场景中,一个亟待回答的问题是: 复杂的多步推理会帮助模型提升医学问答能力吗?要回答这个问题,需要构建足够高质量的医学推理数据,当前医学推理数据的构建存在以下挑 ...