李飞飞的世界模型，大厂在反向操作？

公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统，探索AI对三维世界的理解与重建能力[2] - 公司在短短三个月内完成两轮融资，累计筹集资金约2.3亿美元，估值突破10亿美元，成为AI领域新晋独角兽[2] - 投资方包括a16z、Radical Ventures、NEA、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级机构[2] 技术方向 - 公司致力于从语言模型向世界建模转变，认为真正的智能需要能理解和构建三维世界[5][8] - 核心技术包括NeRF（从二维图像到三维重建）、高斯平面表示法（快速描绘三维场景）、扩散模型（提升三维内容精细度）以及多视角数据融合技术[17][19][20][21] - 物理仿真与动态建模是另一关键技术方向，使AI能预测物体运动变化[23] - 这些技术组合旨在让AI获得类似人类的空间感知能力[24] 应用场景 - 游戏行业：AI可根据照片或视频自动生成逼真三维世界，替代传统手工建模[25] - 建筑行业：几分钟内生成完整空间立体结构，模拟不同光照效果[26] - 机器人领域：赋予机器人三维视觉，解决二维视觉下的空间判断问题[26] - 数字孪生：为工厂、建筑或城市建立虚拟世界进行预测测试[27] - 创意产业：辅助艺术家、设计师进行空间理解和创作[28][29] 行业挑战 - 数据问题：获取足够多包含深度信息、空间结构的真实场景数据成本高[31] - 算力限制：NeRF等技术计算资源需求大，难以大规模落地应用[32] - 泛化能力：现有模型在陌生场景中表现不佳，需要更强适应性[33] - 需要硬件、软件、数据、应用场景的全链路打通，非单一公司能完成[33] 团队优势 - 团队汇聚计算机视觉、图形学、扩散模型、物理仿真和机器人控制等多领域专家[34] - 采用多学科融合的研究范式，探索AI理解三维世界的新路径[35] - 团队背景多元，能从技术、人文、社会等多角度思考AI发展[37] 未来愿景 - AI终极目标是成为人类在物理世界中的智能延伸，而非替代人类[43] - 医疗、建筑、教育等领域将受益于AI的空间理解和操作能力[44] - 世界模型被视为实现通用人工智能（AGI）的第一步，需具备空间感知、动态推理等能力[46] - 代表AI从语言到世界、从二维到三维的演进方向，重新定义人机关系[47]