Energy-Based Reasoning Model (EBM)
搜索文档
LeCun离职后不止创一份业!押注与大模型不同的路线,加入硅谷初创董事会
量子位· 2026-01-30 12:23
核心观点 - 人工智能领域知名学者Yann LeCun在离开Meta后,同时布局了其初创公司AMI以及新加入的初创公司Logical Intelligence,体现了其技术投资多元化的策略[1][2][3] - Logical Intelligence公司选择了一条与当前主流大语言模型截然不同的技术路线,专注于开发“能量-推理模型”,旨在解决需要强逻辑约束和精确推理的复杂问题,这被认为是实现AGI的另一种可能路径[4][5][14][30] 公司技术与产品 - **技术路线**:Logical Intelligence主推“能量-推理模型”,该模型通过为解决方案根据约束条件评分来验证和优化结果,目标是找到能量最低(最符合逻辑、最稳定)的解[5][14][16][17][18] - **核心论点**: 1. 大语言模型依赖离散token,其作为推理模型存在根本性限制[21] 2. 能量-推理模型克服了基于大语言模型的推理模型固有的主要难题[22] 3. 扩展AI推理需要结合能量-推理模型进行推理,并用大语言模型进行协调(尤其是在自然语言交互方面)[23] - **产品发布**:公司已推出首款工作型能量-推理模型Kona,其参数量低于2亿[30][31] - **产品定位**:Kona的目标是解决现实世界中与语言无关、对幻觉容忍度低的复杂问题,例如优化能源网络分配或实现精密制造自动化[42][43] - **训练数据优势**:能量-推理模型的训练数据可以是任何形式,公司策略是为每个独立业务创建较小的定制模型,利用客户特定的数据,且模型能够从稀疏数据中提取完整信息[44][45][46] - **开源计划**:Kona目前为闭源模型,但公司最终会考虑将部分内容开源[47][48] 性能表现与验证 - **测试场景**:公司选择数独游戏作为性能验证场景,因为这是一个典型的强约束、零容错的逻辑问题,能突出能量模型在有限解空间中的搜索效率[39][40][41] - **性能对比**:在单个Nvidia H100 GPU上运行时,Kona模型解决数独问题的速度显著快于主流大语言模型,用时不到1秒即正确完成,而GPT 5.2、Claude Opus 4.5等模型运行超过100秒仍未得出正确结果[6][34][37] - **测试条件**:对比测试中禁止大语言模型使用编程能力进行“暴力解题”[38] 行业观点与人物动态 - **技术信仰契合**:Yann LeCun长期看好能量模型在智能系统中的潜力,其加入Logical Intelligence被视为与其技术信仰高度契合,是两方一拍即合的结果[25][26][27] - **行业批判**:LeCun曾表示,大语言模型的成功使整个AI领域形成了路径依赖,并称人们已被“大语言模型洗脑”[26] - **CEO观点**:Logical Intelligence的CEO Eve Bodnia认为,当前存在的是“大模型泡沫”而非全面的“AI泡沫”,通往AGI的道路需要不同类型的人工智能各司其职[29][30] - **未来愿景**:公司CEO认为,结合大语言模型、能量-推理模型和世界模型(分别负责自然语言交互、推理任务和在3D空间中行动),是迈向AGI的重要一步[30][33]