Llama4.5
搜索文档
LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局
量子位· 2026-01-04 13:21
Meta内部管理与Llama 4事件 - 公司为应对竞争压力,要求GenAI部门加速AI开发和部署,并调派原FAIR团队人员参与Llama 4项目[6] - 团队内部沟通破裂,管理层倾向于已验证的、可直接落地的技术,而研究团队希望探索新方向[7] - Llama 4在基准测试中存在结果被篡改的问题,团队对不同基准测试使用了不同的模型以获取更好结果[1] - Llama 4项目表现不佳且涉及排行榜造假,导致管理层对团队失去信心,并将相关人员边缘化[10] - 事件引发公司团队大换血,一方面天价从外部挖人,另一方面大刀阔斧裁减老员工[11] 关键人物动态:田渊栋 - 田渊栋及其团队在一月份被临时调入Llama 4项目救火,十月份在Llama 4.5训练完成后即被裁撤[13] - 团队被迫放下原有工作,在距离发布截止日期仅剩2个月的情况下接手项目并处理所有棘手工作[14] - 田渊栋曾预想四种可能结局,但最终遭遇第五种结局:未被问责,但整个团队被裁撤[15][16] - 田渊栋在Meta工作十多年,近年已抱有“公司快把我开了吧”的心态,此次变动为其小说创作提供了新素材[18] - 在强化学习与大模型推理方面取得新探索,包括连续隐空间推理(coconut)、Token Assorted、DeepConf、ThreadWeaver等方法提升推理效率,并在可解释性方面研究Grokking现象[19] - 田渊栋已正式宣布创业,将担任一家新初创公司的联合创始人,并拒绝了其他大厂的邀请[33] 关键人物动态:LeCun - LeCun离职后批评公司对大语言模型(LLM)过度沉迷,尤其点名批评新挖来的超级智能实验室成员年轻且缺乏经验[22][23] - LeCun认为LLM本质受限于语言,是实现人类水平智能的“死胡同”,强调需通过世界模型理解物理世界规律[25][26] - LeCun创立新公司Advanced Machine Intelligence (AMI),全力投入开源世界模型研发,其本人担任执行主席而非CEO[27][28][29] - 新公司研究聚焦于V-JEPA架构,旨在通过视频和空间数据学习理解物理世界,使AI具备规划、推理和长期记忆能力[32] - LeCun预计将在12个月内见证该技术的初始版本,并在近几年内实现大规模进展[32] 行业竞争与影响 - DeepSeek的横空出世给公司带来巨大压力,导致Llama 4在发布前即被视为落后,促使公司疯狂加码AI投资[4][5] - 公司内部因竞争压力和高层决策,引发了核心研究人员离职并转向创业的浪潮[3]
传Meta(META.US)力争年底前发布新Llama模型
智通财经· 2025-08-29 12:05
公司战略与投资 - Meta Platforms计划在2024年底前发布下一代人工智能模型Llama4 X或Llama4 5 作为Meta超级智能实验室的首批项目之一 [1] - 公司投资143亿美元获得Scale AI 49%的股份 并聘请其前首席执行官亚历山大 王领导Meta超级智能实验室 [1] - 公司重组人工智能部门为Meta超级智能实验室 设立四个专项小组分别专注于训练 研究 产品和基础设施工作 [1] 产品开发进展 - Llama4系列包含Maverick Scout和Behemoth三款模型 其中Scout和Maverick已于4月5日发布 Behemoth原定6月发布但仍处于开发阶段 [1] - 首席执行官马克 扎克伯格确认Llama4 1和4 2版本开发进展良好 同时正在研发更前沿的下一代模型 [2] 资源投入 - 公司正投入大量资金建设新数据中心 并通过高达数亿美元薪酬方案吸引顶尖人工智能研究人员 [2] - 实验室核心目标是开发人类级别人工智能能力 并将该技术全面应用于公司所有产品线 [2]