公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与重建能力[2] - 公司在短短三个月内完成两轮融资,累计筹集资金约2.3亿美元,估值突破10亿美元,成为AI领域新晋独角兽[2] - 投资方包括a16z、Radical Ventures、NEA、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级机构[2] 技术方向 - 公司致力于从语言模型向世界建模转变,认为真正的智能需要能理解和构建三维世界[5][8] - 核心技术包括NeRF(从二维图像到三维重建)、高斯平面表示法(快速描绘三维场景)、扩散模型(提升三维内容精细度)以及多视角数据融合技术[17][19][20][21] - 物理仿真与动态建模是另一关键技术方向,使AI能预测物体运动变化[23] - 这些技术组合旨在让AI获得类似人类的空间感知能力[24] 应用场景 - 游戏行业:AI可根据照片或视频自动生成逼真三维世界,替代传统手工建模[25] - 建筑行业:几分钟内生成完整空间立体结构,模拟不同光照效果[26] - 机器人领域:赋予机器人三维视觉,解决二维视觉下的空间判断问题[26] - 数字孪生:为工厂、建筑或城市建立虚拟世界进行预测测试[27] - 创意产业:辅助艺术家、设计师进行空间理解和创作[28][29] 行业挑战 - 数据问题:获取足够多包含深度信息、空间结构的真实场景数据成本高[31] - 算力限制:NeRF等技术计算资源需求大,难以大规模落地应用[32] - 泛化能力:现有模型在陌生场景中表现不佳,需要更强适应性[33] - 需要硬件、软件、数据、应用场景的全链路打通,非单一公司能完成[33] 团队优势 - 团队汇聚计算机视觉、图形学、扩散模型、物理仿真和机器人控制等多领域专家[34] - 采用多学科融合的研究范式,探索AI理解三维世界的新路径[35] - 团队背景多元,能从技术、人文、社会等多角度思考AI发展[37] 未来愿景 - AI终极目标是成为人类在物理世界中的智能延伸,而非替代人类[43] - 医疗、建筑、教育等领域将受益于AI的空间理解和操作能力[44] - 世界模型被视为实现通用人工智能(AGI)的第一步,需具备空间感知、动态推理等能力[46] - 代表AI从语言到世界、从二维到三维的演进方向,重新定义人机关系[47]
李飞飞的世界模型,大厂在反向操作?
虎嗅APP·2025-06-06 21:56