65岁LeCun被卷回巴黎老家，与小扎一刀两断，曝光神秘AI初创

核心观点 - Meta首席AI科学家Yann LeCun离职创业其新公司专注于开发基于“世界模型”的高级机器智能旨在让AI理解并预测物理世界这与当前行业过度投资大语言模型的技术路线形成鲜明对立 [1][3][11] - Yann LeCun公开批评大语言模型存在根本性局限认为其已触及天花板并将行业资源视为“黑洞” 阻碍了其他AI路径的发展 [6][8] - Meta公司尽管口头支持LeCun的创业但并未进行财务投资显示出双方在技术路线和商业兴趣上存在分歧 [1][36][38] 关键人物动态 - Yann LeCun在Meta工作12年后将于年底离职并创业其新公司专注于开发“世界模型”以实现高级机器智能 [1][3] - LeCun表示Meta是其新公司的合作伙伴但并非投资者暗示项目范围可能超出Meta的兴趣 [1][36][38] - 媒体报道LeCun计划离职后 Meta股价下跌了2% 据此估计LeCun对Meta的价值约为300亿美元 [38] 技术路线分歧 - Yann LeCun认为大语言模型仅是“token生成器” 缺乏对物理世界的理解、记忆和多步推理能力几乎过时 [6] - LeCun指出大语言模型是自回归的属于System 1 没有真正推理不具备达到人类或狗类智能水平所需的四项能力 [6] - 他认为大语言模型像“黑洞”一样吸干了所有资源和关注导致其他AI研究领域寸草不生 [8] - 与此相对 Meta公司正投入数十亿美元重金招揽大语言模型专家甚至由CEO亲自参与挖角这被视作对LeCun技术路线的一种否定 [8][11] “世界模型”技术理念 - LeCun倡导的“世界模型”是一种基于视觉等感官信息训练的非生成式AI 旨在预测物理世界其理念可追溯至1943年的心理学概念 [3][12][14] - 他认为真正的智能需要构建“心理模型”或内部表征以进行规划、推理和与复杂环境交互而这大部分是通过观察和交互后天学来的 [21][22] - 过去10年 LeCun致力于此方向前5年探索后5年基于非生成式架构取得实质进展并发展出联合嵌入预测架构 [16][20][21] - 世界模型不仅预测下一帧视频更关键的是预测在不同动作下所有可能结果的分布因此需要大量交互数据而不仅是视频数据 [25][26] - LeCun用比喻说明差异：大语言模型像盲目滚下山的雪球而真正的智能应像能感知环境并规划路径的雪人 [27][29][30] 对当前AI发展的批判 - LeCun指出“莫拉维克悖论”依然存在：AI能在律师考试等抽象任务中表现出色但无法让机器人具备五岁孩子的行动能力 [20][21] - 他认为理解物理世界比理解语言更难文本只是对人类丰富感知的高度压缩和抽象描述无法涵盖大部分关于物理世界的直觉和心理模型 [20][32][35] - 人类思考依赖心理意象而非token 因此仅通过缩放语言模型无法产生真正的智能 [20][35] - 他批评硅谷完全被生成式模型迷住暗示其创业需在硅谷之外的非主流环境如巴黎进行 [38] 行业影响与现状 - 全球科技巨头正将数十亿美元投入大语言模型领域并相信缩放定律能支持其通向通用人工智能 [4] - 行业围绕大语言模型迅速形成“共识” 但AI领域最顶尖的科学家对其作为智能路径的根本问题仍存在深刻分歧 [40] - 对智能本质的探索尚无定论技术路径的竞争仍在继续 [40]