Workflow
李飞飞的世界模型,大厂在反向操作?
虎嗅·2025-06-06 14:26

公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与建模能力[2] - 公司在2024年成立后三个月内完成两轮融资,累计筹集2.3亿美元,估值突破10亿美元成为AI领域独角兽[3] - 投资方包括a16z、英伟达NVentures、AMD Ventures、Intel Capital等科技与风投机构[4] 技术方向 - 核心研究方向为"世界模型",即AI对现实世界的三维理解能力,需结合视觉、空间感、动作等多维度信息[15][18] - 关键技术包括:NeRF(神经辐射场)实现二维图像到三维重建、高斯平面表示法提升实时渲染效率、扩散模型优化空间数据细节[30][33][38] - 需突破多视角数据融合与物理动态建模,使AI能预测物体运动(如风吹树叶、球体滚动)[41][46] 应用场景 - 游戏行业:AI根据照片或视频自动生成逼真三维场景,替代传统手工建模[51] - 建筑行业:几分钟内生成立体结构并模拟光照效果,大幅提升设计效率[53] - 机器人领域:赋予三维视觉能力,解决二维视觉导致的距离判断与导航问题[54] - 数字孪生:构建工厂/城市的虚拟副本用于灾害模拟与优化[56] - 创意产业:辅助艺术家进行空间化创作,成为"创作者伙伴"[59] 行业挑战 - 数据瓶颈:需大量带深度信息与空间结构的真实场景数据,目前获取成本高[63][64] - 算力限制:NeRF等技术计算资源需求大,难以大规模商业化落地[66] - 泛化能力:模型在陌生场景中易失效,需提升适应性[67] - 需跨学科协作整合硬件、软件、数据与应用生态[69] 团队与行业趋势 - World Labs团队涵盖计算机视觉、图形学、扩散模型、物理仿真与机器人控制等多领域专家[73][75] - AI研究范式从单一学科转向多学科融合,需集体智慧推动系统工程[77] - 空间智能被视为实现通用人工智能(AGI)的第一步,需具备空间感知与动态推理能力[94][95]