Workflow
超低标注需求,实现医学图像分割,UCSD提出三阶段框架GenSeg
36氪·2025-08-12 11:24

医学图像分割技术 - GenSeg是一种用于训练语义分割模型的三阶段框架,通过数据增强模型与语义分割模型的紧密耦合,显著提升分割模型性能 [2] - 该技术可应用于不同分割模型如UNet和DeepLab,提升其在同数据集和跨数据集场景下的表现 [4] - 框架采用端到端训练方式,包含语义分割模型和掩膜到图像的生成模型两个核心组件 [9] 技术优势 - 在足部溃疡分割任务中,GenSeg-UNet仅需50张图像即可达到Dice分数0.6,相比传统UNet需要的600张减少12倍数据量 [13] - 在皮肤病变分割任务中,GenSeg-DeepLab使用40张ISIC图像即在DermIS测试集上达到Jaccard指数0.67,标准DeepLab使用200张图像仍未达到该水平 [13] - 胎盘血管分割任务中,GenSeg-DeepLab实现0.52 Dice分数,显著优于分离式策略的0.42 [15] 技术原理 - 采用三层优化框架:首阶段训练生成模型参数,次阶段生成合成图像-掩膜对训练分割模型,末阶段根据验证损失反向更新生成模型结构 [9] - 通过多层级优化过程直接以分割性能为目标生成高保真图像-掩膜对,确保合成数据质量与训练效果 [10] - 实验证明端到端优化机制优于分离式策略,且不依赖特定生成模型类型 [17] 应用效果 - 在11个医学图像分割任务和19个数据集上展现强泛化能力,涵盖多种疾病、器官与成像模态 [20] - 同域与跨域设定下均可带来10-20%绝对性能提升,训练数据量仅需现有方法的1/8到1/20 [20] - 支持3D数据分割任务扩展应用 [5] 行业影响 - 突破医学图像分割中标注数据稀缺的关键瓶颈,显著降低医生手工标注负担 [1] - 解决医疗领域数据隐私限制导致的超低数据困境,提升深度学习在数据匮乏场景的可行性 [1][10] - 研究成果发表于Nature Communications期刊,由加州大学圣地亚哥分校团队开发 [8]