研究背景与挑战 - 人工智能基础模型正在利用大规模未标注数据进行预训练,从而彻底改变医疗健康领域[3] - 然而,由于高质量手术数据有限以及实时部署的计算瓶颈,其在术中的应用仍处于探索阶段[3] - 在医疗AI领域,基础模型已在疾病筛查与诊断等术前任务中取得进展,但由于高质量手术数据匮乏和实时部署的计算瓶颈,其在术中的应用面临巨大挑战[6] 研究发布与核心成果 - 2026年3月3日,上海交通大学陈晓军教授等作为共同通讯作者在Nature子刊Nature Biomedical Engineering上发表了相关研究论文[3] - 该研究开发了一种专为显微眼科手术识别与导航设计的眼科视频基础模型(OVFM),以及基于该模型研发的增强现实显微手术导航系统[3] 数据与方法 - 研究团队联合8家医疗中心,构建了一个包含11426个显微手术视频的大规模眼科手术视频数据集[6] - 该数据集涵盖144种眼前段与眼后段手术类型,并被采样为约110万个手术视频片段[6] - 研究团队提出了一种基于自监督视频Transformer架构的预训练策略,通过预测同一视频的不同时空视图,引导OVFM模型学习眼科手术中复杂的时空运动特征[6] 模型性能与优化 - OVFM模型在包括手术步骤识别、器械存在识别、并发症检测及手术场景分割等7个下游任务中,全面超越了现有的视频基础模型[6] - 为满足术中导航的实时响应需求,研究团队设计了一种“从通用到特定任务”的双阶段知识蒸馏框架[6] - 该策略将模型规模最高压缩15.8倍的同时,依然保持了约95%的原始识别精度,成功实现了OVFM在手术显微镜边缘处理单元中的直接部署[6] 系统应用与验证 - 基于轻量化模型,研究团队研发了一套具备场景感知能力的智能手术导航系统[7] - 该系统能够在无需人工干预的情况下自动识别当前手术步骤,并以稳定速率实时投射切口引导线、撕囊范围圆等个性化导航信息[7] - 10位具备不同临床经验的眼科医生参与了离体猪眼白内障手术实验[7] - 实验结果表明,该系统显著改善了主副切口角度误差及连续环形撕囊中心偏差等关键手术指标[7] - 新手医生在系统辅助下展现出了比专家医生更大幅度的性能提升[7] 研究意义与前景 - 这项研究通过跨中心数据构建、核心算法设计与软硬件系统开发,展示了眼科视频基础模型在场景理解、实时响应和眼科医生技能增强等方面的潜能[9] - 该研究为下一代高性能、智能化的超显微外科手术导航及机器人系统的研发提供了全新的技术路径[9]
Nature子刊:上海交大陈晓军团队等开发AI新模型,用于显微眼科手术识别与导航
生物世界·2026-03-14 16:30