65岁LeCun被卷回巴黎老家,与小扎一刀两断,曝光神秘AI初创
Meta PlatformsMeta Platforms(US:META) 36氪·2025-12-05 19:45

核心观点 - Meta首席AI科学家Yann LeCun离职创业 其新公司专注于开发基于“世界模型”的高级机器智能 旨在让AI理解并预测物理世界 这与当前行业过度投资大语言模型的技术路线形成鲜明对立 [1][3][11] - Yann LeCun公开批评大语言模型存在根本性局限 认为其已触及天花板 并将行业资源视为“黑洞” 阻碍了其他AI路径的发展 [6][8] - Meta公司尽管口头支持LeCun的创业 但并未进行财务投资 显示出双方在技术路线和商业兴趣上存在分歧 [1][36][38] 关键人物动态 - Yann LeCun在Meta工作12年后将于年底离职并创业 其新公司专注于开发“世界模型”以实现高级机器智能 [1][3] - LeCun表示Meta是其新公司的合作伙伴但并非投资者 暗示项目范围可能超出Meta的兴趣 [1][36][38] - 媒体报道LeCun计划离职后 Meta股价下跌了2% 据此估计LeCun对Meta的价值约为300亿美元 [38] 技术路线分歧 - Yann LeCun认为大语言模型仅是“token生成器” 缺乏对物理世界的理解、记忆和多步推理能力 几乎过时 [6] - LeCun指出大语言模型是自回归的 属于System 1 没有真正推理 不具备达到人类或狗类智能水平所需的四项能力 [6] - 他认为大语言模型像“黑洞”一样吸干了所有资源和关注 导致其他AI研究领域寸草不生 [8] - 与此相对 Meta公司正投入数十亿美元重金招揽大语言模型专家 甚至由CEO亲自参与挖角 这被视作对LeCun技术路线的一种否定 [8][11] “世界模型”技术理念 - LeCun倡导的“世界模型”是一种基于视觉等感官信息训练的非生成式AI 旨在预测物理世界 其理念可追溯至1943年的心理学概念 [3][12][14] - 他认为真正的智能需要构建“心理模型”或内部表征 以进行规划、推理和与复杂环境交互 而这大部分是通过观察和交互后天学来的 [21][22] - 过去10年 LeCun致力于此方向 前5年探索 后5年基于非生成式架构取得实质进展 并发展出联合嵌入预测架构 [16][20][21] - 世界模型不仅预测下一帧视频 更关键的是预测在不同动作下所有可能结果的分布 因此需要大量交互数据而不仅是视频数据 [25][26] - LeCun用比喻说明差异:大语言模型像盲目滚下山的雪球 而真正的智能应像能感知环境并规划路径的雪人 [27][29][30] 对当前AI发展的批判 - LeCun指出“莫拉维克悖论”依然存在:AI能在律师考试等抽象任务中表现出色 但无法让机器人具备五岁孩子的行动能力 [20][21] - 他认为理解物理世界比理解语言更难 文本只是对人类丰富感知的高度压缩和抽象描述 无法涵盖大部分关于物理世界的直觉和心理模型 [20][32][35] - 人类思考依赖心理意象而非token 因此仅通过缩放语言模型无法产生真正的智能 [20][35] - 他批评硅谷完全被生成式模型迷住 暗示其创业需在硅谷之外的非主流环境如巴黎进行 [38] 行业影响与现状 - 全球科技巨头正将数十亿美元投入大语言模型领域 并相信缩放定律能支持其通向通用人工智能 [4] - 行业围绕大语言模型迅速形成“共识” 但AI领域最顶尖的科学家对其作为智能路径的根本问题仍存在深刻分歧 [40] - 对智能本质的探索尚无定论 技术路径的竞争仍在继续 [40]