文章核心观点 - 李飞飞提出反共识观点,认为单纯的大语言模型无法通往通用人工智能,空间智能才是AI发展的下一个前沿和更优路径 [4][5][6] - World Labs公司正致力于构建具有物理一致性的世界模型,其首款产品Marble是一个多模态空间智能模型,旨在让AI理解并与三维物理世界互动 [4][7][16] - 随着合成数据等技术的成熟,世界模型领域预计将迎来类似大语言模型的规模定律爆发时刻 [8][9] - 通用机器人是比自动驾驶更高维度的挑战,也是AI技术的“皇冠”,其成功需要空间智能的支持 [10] - AI技术的终极目标是像电力一样,成为赋能各行各业、提升人类文明的基础设施 [11][12] AGI发展路径与空间智能的重要性 - 从生物进化视角看,视觉、触觉等空间感知能力已有约5亿年演化历史,而语言仅有约50万年历史,因此空间智能是比语言更古老、更基础的智能形式 [5][14] - 如果AI只有语言能力,将被困在数字世界,只有补齐空间智能,使其具备理解、推理并与三维物理世界互动的能力,才能真正通往通用人工智能 [6][15] - 空间智能被定义为在真实3D、4D物理世界中进行理解、推理、交互和导航的基础性能力,是AI的下一个前沿领域 [13][15] World Labs的产品与技术:Marble世界模型 - Marble是公司第一代空间智能模型,能接收句子、图片、视频或简单3D输入,并将其转化为完全可导航、可交互且具有永久一致性的3D世界 [7][16] - 与Sora等视频模型不同,Marble生成的环境拥有几何结构和物理一致性,不仅仅是一段像素动画,而是拥有物理属性的虚拟空间 [7] - 该模型目前规模比GPT-5等大语言模型小几个数量级,GPT-5的训练量约在10^26 FLOPS级别 [23] - 公司采用混合数据策略来训练模型,结合互联网现有的文本、图像、视频数据、仿真模拟数据以及真实世界采集的数据,以解决物理世界数据信噪比低、难以大规模获取的瓶颈 [8][24][25] 应用场景与市场潜力 - Marble已应用于游戏开发、影视特效、机器人训练、室内设计等领域 [7][17] - 出现了意想不到的用例,如临床研究人员利用其生成个性化沉浸式环境用于治疗强迫症等心理疾病,以及用于个性化健身训练环境 [7][17][18] - 空间智能是一项横向技术,未来潜在应用领域广泛,包括医疗健康、教育、现场服务、金融服务、农业制造、仓储检测及城市规划等 [12][26] 行业发展趋势与挑战 - 世界模型领域仍处于早期阶段,在模型架构等方面仍在探索,但预计未来几年将见证其在规模定律曲线上实现飞跃 [24] - 物理世界数据(像素、体素)比文本数据更混乱、获取更难,这曾是发展瓶颈,但合成数据技术的成熟正推动该领域进步 [8][24] - 算力增强、芯片进步以及生态系统成熟(如三年前还不存在的数据供应商出现)正在加速该领域发展 [25] - 合成数据与模型生成能力可形成相互促进的飞轮效应 [25] 对关键AI技术领域的看法 - 通用机器人被视为比自动驾驶更高维度的AI技术挑战:自动驾驶是2D逻辑,核心是避障;通用机器人是3D逻辑,核心是在三维空间中以不破坏物体的方式进行精确接触操作 [10][25][26] - 实现通用机器人面临巨大挑战,包括手部模拟的高难度、视觉精准度以及空间理解的需求 [26] - 自动驾驶技术从概念到大规模城市街道运行(如Waymo)经历了漫长的旅程,预示通用机器人的发展也可能需要长期努力 [25]
李飞飞的反共识判断
虎嗅APP·2026-02-08 17:42