Workflow
豆蔻妇科大模型再突破:钉钉行业训练平台+精标数据SFT ,准确率从 77.1%上升至 90.2%
钛媒体APP·2025-07-10 15:49

文 | 王强宇 在医疗 AI 领域,通用大语言模型虽凭借海量互联网数据训练具备广泛知识覆盖面,但在需高度专业判 断的临床场景中表现欠佳。当医生询问疾病鉴别诊断时,通用模型可能给出不准确甚至错误建议,这在 严肃的医疗决策中不可接受。 大家都知道监督微调(SFT)技术是解决上述难题性价比较比较高的方案之一,但SFT也需要具体一定 的条件:如高质的数据集,同时由于医疗数据的特殊性和复杂性,模型调优的过程可能非常耗时且难以 预测。同时SFT是一个迭代优化的过程,需要不断地对模型进行训练、评测和优化。 豆蔻妇科大模型的模型调优经历了两个关键优化阶段: 以下是豆蔻妇科大模型从第一个版本的准确率77.1%,通过进一步的SFT后,准确率达到90.2%我们团队 的一些方法和心得,供大家参考,欢迎留言讨论。 一、训练数据集的科学筛选(数据集构建与质量控制) 在对优质训练数据集的筛选过程中,我们实施了三个关键步骤: 第一是系统化数据清理,通过建立严格的质量控制标准,重点关注推理与结果的一致性检查,筛选出 answer与ground truth不一致的样本,特别是那些思考过程和输出结果不一致的情况,这类数据被视为低 质量数据。同时进 ...