Workflow
JEPAs
icon
搜索文档
备受Meta折磨,LeCun依旧猛发论文,新作:JEPAs不只学特征,还能精准感知数据密度
36氪· 2025-10-09 19:39
研究核心发现 - Yann LeCun团队发现自监督模型JEPAs在训练过程中自动掌握了感知数据常见程度的能力,即学习数据的“密度” [1] - 这一发现打破了学界长期认为JEPAs仅学习特征、与数据密度无关的认知 [3] - 研究证明,学习数据密度是JEPAs训练过程中的必然结果,而非偶然 [8] JEPAs模型技术背景 - JEPAs是LeCun团队重点推进的自监督学习框架,核心优势在于无需人工标注即可从海量数据中学习特征规律 [6] - 模型训练包含两个核心目标:latent空间预测和反坍缩 [11] - 反坍缩原本被视为避免特征失效的保障手段,但本研究揭示了其隐藏价值,即能精准学习数据密度 [7][8] JEPA-SCORE工具与应用 - 团队提出关键工具JEPA-SCORE,用于从JEPAs中提取数据密度并量化样本常见度 [10] - JEPA-SCORE计算逻辑简洁高效,仅需获取雅可比矩阵并计算其特征值对数求和,分数越高表示样本越典型 [10] - 该工具具备极强通用性,不限制数据集和JEPAs架构,在ImageNet、MNIST及陌生星云图集上均能精准计算 [11] - 在数据筛选和异常检测的实用测试中,JEPA-SCORE效果优于传统方法 [13] 实验验证 - 在ImageNet数据集中,不同JEPAs模型对典型样本和罕见样本的JEPA-SCORE判定高度重合,证明此为模型共性能力 [11] - 面对未参与预训练的星系图像数据集,其JEPA-SCORE显著低于ImageNet数据,表明模型能精准识别陌生数据 [11] 研究团队 - 此项研究由Yann LeCun与三位Meta FAIR研究员共同完成 [20] - 团队成员包括布朗大学计算机科学助理教授Randall Balestriero、FAIR研究科学家Nicolas Ballas以及FAIR创始成员Michael Rabbat [22][23][25]
备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度
量子位· 2025-10-09 12:52
文章核心观点 - Yann LeCun团队的最新研究发现,自监督模型JEPAs具备感知数据常见程度(即数据密度)的隐藏能力,打破了学界认为其仅擅长特征提取的固有认知 [1][2][7] - 该能力源于模型训练中的“反坍缩”机制,是训练过程的必然结果,无需额外操作即可用于判断样本的常见程度 [6][11] - 团队提出了量化工具JEPA-SCORE,可广泛应用于不同数据集和模型架构,进行数据密度评估 [14][16][17] JEPAs模型与数据密度发现 - JEPAs是LeCun团队重点推进的自监督学习框架,核心优势在于无需人工标注即可从海量数据中学习特征规律 [10] - 传统观点认为JEPAs训练仅有两个核心目标:潜在空间预测和防止特征坍缩(反坍缩) [10][12] - 新研究通过变量替换公式与高维统计特性推导证明,反坍缩机制能让JEPAs精准学习数据密度,当模型输出高斯嵌入时,必须通过雅可比矩阵感知数据密度以满足训练约束 [11] JEPA-SCORE工具与应用 - JEPA-SCORE是从JEPAs中提取数据密度的量化指标,通过计算模型处理目标样本时雅可比矩阵的特征值对数求和得出,分数越高表示样本越典型常见 [14][15] - 该工具具备极强的通用性,不限制数据集和JEPAs架构,无论是ImageNet、MNIST还是未参与预训练的星云图集,以及I-JEPA、DINOv2、MetaCLIP等模型均可直接使用 [16][17] - 实验验证表明,不同JEPAs模型对典型样本和罕见样本的JEPA-SCORE判定高度重合,且能精准识别陌生数据,证明这是模型的共性能力 [18] 研究团队 - 此次研究由Yann LeCun与三位Meta FAIR的研究员共同完成 [26][27] - 团队成员包括布朗大学计算机科学助理教授Randall Balestriero、拥有法国格勒诺布尔大学博士学位的Nicolas Ballas以及FAIR创始成员Michael Rabbat [28][32][34]