JEPA架构
搜索文档
杨立昆再联手谢赛宁,英伟达参投,新公司押注「LLM 之后」
36氪· 2026-03-10 13:17
公司融资与估值 - 公司AMI已完成10.3亿美元融资,投前估值为35亿美元 [1] - 本轮融资由凯辉创新、Greycroft、Hiro Capital、HV Capital、贝索斯远征共同领投 [4] - 战略投资方包括英伟达、丰田创投、淡马锡、软银、马克·库班、穆里耶家族等,跟投方包括埃里克·施密特、阳狮集团、三星、蒂姆·博纳斯·李等 [4][5] 公司核心团队与背景 - 公司由前Meta首席AI科学家、图灵奖得主杨立昆创办 [1] - 首席科学官谢赛宁已加入,他是视觉表征学习权威,也是扩散变换器DiT的共同作者 [2] - 六位核心创始人中,四位直接来自Meta的FAIR团队,另外两位也有深厚的Meta渊源 [3][18] - 公司CEO由连续创业者亚历山大·勒布恩担任,COO劳伦·索利曾任Meta欧洲业务VP,是连接欧洲政商渠道的关键 [22][20] - 世界模型副总裁由原FAIR蒙特利尔实验室创始成员迈克尔·拉巴特担任,他主持研发了V-JEPA系列 [10][18] - 首席研究与创新官由香港科技大学讲席教授、计算机科学家冯雁担任 [19] 公司技术方向与愿景 - 公司以研发“世界模型”为主要方向,旨在开发能从真实世界学习抽象表征的AI系统 [1] - 技术路径基于杨立昆提出的JEPA架构,核心是让模型学习世界的“抽象表征”并在该空间做预测,而非还原所有细节 [6][10] - 公司旨在打造能理解世界、具备长期记忆、能进行真正推理和计划、且端到端安全可控的新一代AI系统 [8] - 杨立昆认为达到人类级别智慧的AI系统不会建立在LLM之上,需要概念性突破 [12] - 公司目标是在欧洲建立独立于美国和中国的前沿AI“第三极”,路线是开源 [24] 行业背景与竞争格局 - 大语言模型在2023年ChatGPT爆发后几乎成为AI代名词,但杨立昆持续公开批评其本质是文字统计规律,无法理解物理世界进行推理和规划 [5][6] - 公司认为当前AI需超越屏幕限制,理解情境、保存上下文、预测结果并随时间做出可靠行为 [8] - 杨立昆呼吁学界不要只做LLM,应去发明新技术,解决当前系统之外的问题 [12] - 公司投资方高度多元化,涵盖全球AI霸主、主权基金、科技大佬及终端应用公司,显示出对建立欧洲AI生态的广泛支持 [24] 相关技术与研发基础 - 谢赛宁是DiT架构共同作者,该架构用Transformer替代U-Net,提升了图像/视频生成模型的质量和可扩展性,为Sora、SeeDance等模型打下基础 [2][13] - 谢赛宁在纽约大学推进的世界模型研究包括使用Minecraft构建的多人视频世界模型“Solaris”,用于测试AI在动态环境下的预测与规划能力 [10] - 迈克尔·拉巴特在FAIR研发的V-JEPA 2通过视频自监督训练,仅用不到62小时机器人操作数据即可零样本控制机械臂完成抓取任务 [19] - 谢赛宁的其他代表作包括ConvNeXt、MAE和MoCo,这些工作对视觉网络架构和自监督学习产生了重要影响 [14] 公司运营与战略 - 公司总部位于巴黎,并计划设立纽约、蒙特利尔和新加坡办公室 [3] - 本轮融资将用于支持长期科研、全球范围招聘以及世界模型方向上的可靠产品开发 [2] - 杨立昆表示Meta可能会成为公司的第一个客户 [3] - 公司团队在某种意义上是对FAIR蒙特利尔和巴黎团队的“精华重组” [18]