Workflow
Meta「分割一切」3.0曝光,技能语义分割加入概念提示,好好玩,要爆了
Meta PlatformsMeta Platforms(US:META) 36氪·2025-10-13 11:52

传统语义分割好无趣好无聊,技能语义分割加入概念提示,好好玩,要爆了。(doge) SAM 3——第三代"分割一切"模型刚刚被发现,已经悄然投稿ICLR 2026。 论文还在双盲评审阶段,作者匿名中,但标题暴露一切。 简单来说,就是在这个官方新版中,分割模型终于能听懂人话了:只要说出想要的东西,SAM 3就能在图像/视频中分割出对应实例。 比如,输入"条纹猫",SAM 3自己就能找出并分割图中所有带条纹的猫猫: 值得一提的是,SAM 3处理一张含100多个物体的图片仅需30ms,对视频也有近实时处理能力。 能听懂人话的SAM SAM 1引入了基于点、框、掩码等视觉提示的交互式分割任务,开辟了分割模型的新范式;SAM 2则在此基础之上,加入了对视频和记忆的支持。 这一次,SAM 3让这种交互式分割更进一步:支持基于短语、图像示例等概念提示的多实例分割任务——对,捎带手突破了前代只能处理单个实例的局 限。 论文中,SAM 3的研究团队将这种新任务范式命名为PCS(Promptable Concept Segmentation)。 PCS:可提示概念分割 PCS的定义是,给定图像或视频,模型能够基于短语、图像示例,或 ...