开放词汇分割(Open-Vocabulary Segmentation

搜索文档
开放词汇分割新SOTA!Talk2DINO:让分割又快又准还懂人话~
自动驾驶之心· 2025-07-27 22:41
点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我 -> 领取大模型巨卷干货 今天 大模型之心Tech 为大家分享一篇被 ICCV 2025 接收的多模态模型相 关 工作。 本文提出了 Talk2DINO ,旨在解决开放 词汇分割(OVS)任务中视觉 - 语言模型空间定位能力不足与自监督视觉模型缺乏语言整合的问题。 如果您有相 关工作需要分 享,请在文末联系我们! >> 点击进入→ 大模型技术 交流群 本文只做学术分享,如有侵权,联系删文 论文标题:Talking to DINO: Bridging Self-Supervised Vision Backbones with Language for Open-Vocabulary Segmentation 论文链接:https://arxiv.org/pdf/2411.19331 开源链接:https://lorebianchi98.github.io/Talk2DINO/ 背景与动机 开放词汇分割(Open-Vocabulary Segmentation, OVS) 是计算机视觉领域的一项基础任务,其目标是根据推理时提供的自然语言概念,将输入图像 ...