Workflow
Joint Embedding Prediction Architecture (JEPA)
icon
搜索文档
LeCun 手撕 Meta:Llama 4 造假,小扎直接废掉整个 AI 团队,锐评 28 岁新上司:不懂研究还瞎指挥
AI前线· 2026-01-03 15:56
Meta AI团队动荡与Llama 4丑闻 - 核心观点:Meta前首席科学家Yann LeCun在专访中揭露公司AI研发存在严重问题,包括Llama 4基准测试结果人为操纵、团队被边缘化、战略方向存在根本分歧,这导致其本人离职并创立新公司押注全新AI架构[2][4] - Meta的Llama 4模型基准测试结果存在人为操纵,工程师针对不同测试采用不同模型变体以优化分数,而非展示真实能力[4] - 该事件导致首席执行官Mark Zuckerberg对现有AI团队失去信任,整个生成式AI团队被边缘化,多人已离职或即将离开[5] - 为应对失利,Meta于2025年6月斥资约150亿美元收购数据标注初创企业Scale AI大量股份,并聘请其28岁的首席执行官Alexandr Wang牵头组建新的前沿AI研究部门TBD实验室[5] - 公司还展开了声势浩大的挖人行动,据称向竞争对手的顶尖研究员开出了1亿美元的签约奖金[6] 管理层变动与内部矛盾 - 对Alexandr Wang的任命造成了令人错愕的上下级反转,作为图灵奖得主和领域奠基人的LeCun需向这位28岁、主业为数据标注的年轻人汇报[8] - LeCun直接批评Wang毫无研究经验,既不懂研究如何开展与落地,也不知道如何吸引研究员[8] - LeCun强调无人能对他这样的研究员指手画脚,尽管有汇报关系,但Wang实际上并未对他发号施令[8] - 双方更深层的矛盾源于根本性的理念分歧:Wang代表Meta押注语言模型规模化的战略方向,而LeCun认为这一范式从根本上误入了歧途[9] 对大型语言模型技术路线的批判 - LeCun认为,Meta沿用OpenAI已触及天花板的架构方案进行竞争,该方案无法实现公司宣称要追逐的智能目标[9] - 他长期批判大型语言模型局限性过大,指出语言载体对于培养真正智能存在根本性的带宽不足问题[10] - 他测算,通读互联网全部文本(约2×10¹³字节)需要17万年,而一个四岁孩童通过视觉输入接收的信息量(约10¹⁵字节)就比LLM从全部书面语料中提取的内容多出50倍[10] - 训练大型语言模型如同仅通过阅读书籍学习木工,无法理解物理原理,这解释了AI在驾驶、清洁等需要物理交互的任务上长期存在短板[10][11] - 2025年11月,OpenAI前首席科学家Ilya Sutskever也表示,领域正从“规模化时代”迈向“研究时代”,单纯算力扩张的边际效益递减[11] LeCun的新技术路径与创业 - LeCun提出名为联合嵌入预测架构的世界模型架构,通过对视频与空间数据训练,培养系统基于物理原理的认知能力和持久记忆[13] - 他给出了该架构的落地时间表:12个月内推出雏形版本,数年内实现更大规模部署应用[14] - 他创办的初创公司命名为“先进机器智能”,技术路径正是他所主张的、比大型语言模型更具优势的方案,他将出任执行董事长而非CEO[14] - LeCun预测,具备动物级智能水平的AI将在五到七年内实现,而达到人类级智能则需要十年时间[14]