World API
搜索文档
世界模型怎么才算“能用”?李飞飞把它做成了 API
36氪· 2026-01-29 09:07
核心观点 - World Labs推出的World API标志着人工智能从生成视频内容向构建可交互三维空间的重大跨越,其核心是生成具备物理规则与几何结构的数字世界,旨在赋予机器空间智能[1] - 该产品定位为下一代空间智能的底层平台和可编程空间的基础设施,而非简单的生成式AI应用,公司正洽谈新一轮融资,目标估值达50亿美元,是此前10亿美元估值的五倍[8][11] 产品定位与技术差异 - World API生成的是完整的空间结构和几何模型,具备物理关系和可交互性,与Sora等生成固定角度连续视频流的工具有本质区别,后者是给人看的内容,而前者是给机器用的环境[1][2] - 其输出正从内容变成环境,解决的是“能做什么”的问题,为游戏、机器人训练、VR/AR等需要可探索、可训练、可沉浸空间的场景提供基础[3][5] 核心技术能力 - 采用多模态输入技术,支持文本、图片、视频、全景图,通过融合语言、语义、几何和物理信息来还原完整的3D空间[7] - 具备语义理解与编辑能力,能理解“沉重”、“中央”等自然语言中蕴含的物理和空间信息,无需创作者转换为精确数值或学习专业软件[8] - 提供可视化工具Chisel(凿子),允许用户通过放置几何约束来辅助AI生成完整场景,降低了3D内容创作门槛[8] 目标市场与应用场景 - 主要面向三类核心应用场景:游戏开发(可快速生成可用关卡)、机器人训练(可从视频生成可训练的3D仿真环境)、VR/AR(降低3D内容制作门槛)[9] - 技术下一步方向是引入动力学,如模拟树木摇摆、物体形变、光照变化,以增强真实感并满足物理仿真和机器人训练的需求[9] 行业竞争格局 - 与OpenAI、Google等公司的重点不同:OpenAI主攻对话和通用Agent,重心不在空间理解;Google的Genie 3等世界模型更偏向研究和特定场景[10][11] - World Labs专注于构建可编程空间的基础设施,其World API生成的是可直接接入各种系统的空间数据,占据底层平台位置[11]
李飞飞世界模型公司一年估值暴涨5倍,正洽谈新一轮5亿美元融资
36氪· 2026-01-26 08:45
公司融资与估值动态 - World Labs正以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元 [1] - 若融资完成,公司估值将从2024年的10亿美元跃升至50亿美元,实现一年多时间5倍增长 [2] - 此前公司已完成累计2.3亿美元融资,估值达到10亿美元 [3] - 公司成立于2024年4月,当月完成首轮融资,估值约2亿美元 [3] - 2024年6-7月,公司完成由NEA领投的1亿美元融资,估值超10亿美元,跻身独角兽 [6] 投资方背景 - 早期投资方包括Andreessen Horowitz (a16z) 和 Radical Ventures [6] - 后续融资投资方包括英伟达、沙特Sanabil Investments、新加坡淡马锡 [6] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton [6] 技术路线与产品 - 公司核心研发方向为“世界模型”,旨在构建能在三维世界中导航和决策的AI系统,即“大世界模型” [6] - 世界模型致力于让AI理解真实物理世界的结构与演化方式,而非仅生成图像 [6] - 公司已推出首款3D世界生成模型Marble,可根据文本或图像提示生成可探索的3D世界 [7][9] - Marble采用3D高斯溅射技术,用数百万计的半透明点表示场景结构,兼顾渲染效率与视觉效果 [9] - 该模型同时输出“碰撞网格”,专用于物理仿真和机器人模拟 [9] - 公司提供Chisel工具,允许用户先用简单几何体搭建骨架,再生成不同风格的细节版本 [9] - 公司近期开放了World API,开发者可通过文本、图像或视频在应用中生成可探索的3D世界 [9] 战略愿景与行业定位 - 公司创始人认为世界模型是实现空间智能的关键,是继大语言模型之后AI下一个十年的核心主线 [10] - 具备空间智能的世界模型需拥有三种能力:生成遵守物理定律的世界、处理多模态输入、预测世界随时间演变或互动的状态 [11] - 世界模型被视为“基础设施型能力”,其影响将扩散至多个方向 [12] - 应用方向包括AIGC(如3D资产生成、游戏世界构建、影视制作)和具身智能(如机器人、仿真环境) [12][13] - 在具身智能领域,世界模型提供对环境的可预测表示,是叠加有效决策与控制的基础 [13] 行业竞争格局 - 世界模型领域存在不同技术路线,前Meta首席科学家Yann LeCun创办的AMI Labs正以约35亿美元估值进行融资 [15] - LeCun的路线采用隐式世界模型,基于联合嵌入预测架构在抽象潜在空间中预测世界演化,而非还原每个像素 [16] - 当前世界模型版图大致分为三层:可观看编辑的世界界面(如Marble)、可反复试错的模拟器、以状态与预测为核心的认知世界模型(如JEPA路线) [18] - 资本押注反映了对不同世界模型技术路径的前瞻性布局 [18]
李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资
量子位· 2026-01-25 14:00
World Labs新一轮融资与估值跃升 - 公司正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元[1] - 若融资完成,公司估值将从2024年的10亿美元跃升至50亿美元,实现一年多时间5倍重估[2] - 此前公司已完成累计2.3亿美元融资,估值达到10亿美元[2] - 公司成立于2024年4月,当月完成首轮融资,估值约2亿美元[2] 公司历史融资与投资方 - 首轮投资方包括Andreessen Horowitz(a16z)和加拿大投资机构Radical Ventures[5] - 2024年6–7月,公司完成一轮1亿美元融资,由NEA领投,估值被抬升至超过10亿美元[5] - 历史投资方还包括英伟达、沙特阿拉伯的Sanabil Investments、新加坡主权基金淡马锡[5] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton[6] 公司核心业务:世界模型 - 公司正在研发能够在三维世界中进行导航和决策的AI系统,构建“大世界模型”[8] - 目标并非“生成一张好看的图”,而是让模型真正理解真实物理世界的结构与演化方式[9] - 世界模型被视为继大语言模型之后,AI下一个十年的核心主线,是一种“基础设施型能力”[16][17] 产品与技术:Marble与World API - 公司于去年11月推出首款3D世界生成模型Marble[10] - Marble可以根据文本或图像提示,直接生成可探索的3D世界[12] - 技术采用3D高斯溅射,用数以百万计的半透明点表示场景结构,在保持较高渲染效率的同时实现更细腻的视觉效果[14] - Marble同时输出“碰撞网格”,专门用于物理仿真和机器人模拟[15] - 提供Chisel工具,用户可先用简单几何体快速搭建骨架,再生成不同风格的细节版本[15] - 公司近期开放了World API,开发者可通过文本、图像或视频直接生成可探索的3D世界[15] 世界模型的应用前景与能力框架 - 真正具备空间智能的世界模型需要三种能力:生成、多模态、交互[22] - 生成能力指能创造遵守物理定律、空间一致的世界[22] - 多模态能力指能处理从图像、视频到动作的多模态输入[22] - 交互能力指能预测世界随时间演变或互动的状态[22] - 应用方向包括AIGC(如3D资产生成、游戏世界构建、影视制作)和具身智能(如机器人、仿真环境)[22] - 以具身智能为例,世界模型提供对环境的可预测表示,是叠加有效决策与控制的基础[18] 行业竞争格局与技术路线 - 前Meta首席科学家Yann LeCun创办的AMI Labs传闻融资估值可能达到35亿美元[20] - LeCun的路线更偏向“内在认知”,采用隐式世界模型,基于JEPA在抽象的潜在空间中预测世界演化,而非还原每一个像素[21] - 世界模型技术版图大致分三层:可观看、可编辑的世界界面(如Marble);可反复试错的模拟器(如谷歌DeepMind的Genie 3);以状态与预测为核心的认知世界模型(如LeCun的JEPA路线)[27][24] - 资本押注的是对不同世界模型技术路径的提前下注[24]