Workflow
Chisel
icon
搜索文档
李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资
量子位· 2026-01-25 14:00
World Labs新一轮融资与估值跃升 - 公司正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元[1] - 若融资完成,公司估值将从2024年的10亿美元跃升至50亿美元,实现一年多时间5倍重估[2] - 此前公司已完成累计2.3亿美元融资,估值达到10亿美元[2] - 公司成立于2024年4月,当月完成首轮融资,估值约2亿美元[2] 公司历史融资与投资方 - 首轮投资方包括Andreessen Horowitz(a16z)和加拿大投资机构Radical Ventures[5] - 2024年6–7月,公司完成一轮1亿美元融资,由NEA领投,估值被抬升至超过10亿美元[5] - 历史投资方还包括英伟达、沙特阿拉伯的Sanabil Investments、新加坡主权基金淡马锡[5] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton[6] 公司核心业务:世界模型 - 公司正在研发能够在三维世界中进行导航和决策的AI系统,构建“大世界模型”[8] - 目标并非“生成一张好看的图”,而是让模型真正理解真实物理世界的结构与演化方式[9] - 世界模型被视为继大语言模型之后,AI下一个十年的核心主线,是一种“基础设施型能力”[16][17] 产品与技术:Marble与World API - 公司于去年11月推出首款3D世界生成模型Marble[10] - Marble可以根据文本或图像提示,直接生成可探索的3D世界[12] - 技术采用3D高斯溅射,用数以百万计的半透明点表示场景结构,在保持较高渲染效率的同时实现更细腻的视觉效果[14] - Marble同时输出“碰撞网格”,专门用于物理仿真和机器人模拟[15] - 提供Chisel工具,用户可先用简单几何体快速搭建骨架,再生成不同风格的细节版本[15] - 公司近期开放了World API,开发者可通过文本、图像或视频直接生成可探索的3D世界[15] 世界模型的应用前景与能力框架 - 真正具备空间智能的世界模型需要三种能力:生成、多模态、交互[22] - 生成能力指能创造遵守物理定律、空间一致的世界[22] - 多模态能力指能处理从图像、视频到动作的多模态输入[22] - 交互能力指能预测世界随时间演变或互动的状态[22] - 应用方向包括AIGC(如3D资产生成、游戏世界构建、影视制作)和具身智能(如机器人、仿真环境)[22] - 以具身智能为例,世界模型提供对环境的可预测表示,是叠加有效决策与控制的基础[18] 行业竞争格局与技术路线 - 前Meta首席科学家Yann LeCun创办的AMI Labs传闻融资估值可能达到35亿美元[20] - LeCun的路线更偏向“内在认知”,采用隐式世界模型,基于JEPA在抽象的潜在空间中预测世界演化,而非还原每一个像素[21] - 世界模型技术版图大致分三层:可观看、可编辑的世界界面(如Marble);可反复试错的模拟器(如谷歌DeepMind的Genie 3);以状态与预测为核心的认知世界模型(如LeCun的JEPA路线)[27][24] - 资本押注的是对不同世界模型技术路径的提前下注[24]
李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时代!
量子位· 2026-01-19 11:48
文章核心观点 - 具身智能行业正面临模型进步速度远超评测能力的瓶颈,规模化评测成为关键制约因素[18][20][22][23] - 为解决此问题,行业两大关键基础设施公司——李飞飞旗下的世界模型公司World Labs与仿真合成数据公司光轮智能宣布合作,标志着具身智能正式迈入“评测驱动时代”[1][2][76] - 双方合作基于“数字表亲”理念,分工明确:World Labs的Marble产品解决高保真3D环境生成的规模问题,光轮智能则提供与真实物理对齐的资产及评测闭环,共同构建可规模化运行的仿真评测系统[3][45][49][51] World Labs(世界模型公司)分析 - 公司由AI领域权威人物李飞飞创立,成立仅两年已融资数亿美元,股东包括Andreessen Horowitz、英伟达、Databricks、Adobe等顶级风投与AI生态公司[4][5][17] - 公司选择“空间智能”作为AGI发展路线,旨在构建能感知、生成、推理并与环境互动的世界模型,以突破大语言模型的智能天花板[6][7] - 核心产品Marble是一款可视化世界模型,仅需一句话、一张图片或一段视频等轻量输入,即可生成高保真、持久、可下载的3D环境,支持导出多种格式,并内置AI世界编辑器Chisel[8][9][11][12][14] - Marble主要服务于视觉特效、游戏开发等领域,实现了“一句提示→生成3D世界→一键导出至Unity”的生产力链路,但其生成的世界缺乏物理参数,需与物理引擎结合才能用于机器人训练与评测[15][16][36] 光轮智能(仿真合成数据公司)分析 - 公司是当前最炙手可热的具身智能基建公司,与英伟达关系紧密,深度参与其仿真系统底层共建,是Newton物理引擎的早期验证者和开发合作者[54][55] - 公司在仿真合成数据市场占有率极高,服务了全球前三的世界模型公司,国际主要具身团队的仿真资产和合成数据80%以上来自光轮智能[58][59] - 公司构建了三位一体的自研仿真技术体系:1)自研GPU物理求解器,支持百万级自由度并行计算;2)全自动虚实对标物理测量工厂;3)将真实物理特性规模化映射为SimReady资产与场景[52] - 基于其基础设施地位,公司推出了工业级仿真评测平台RoboFinals,并与英伟达联合打造了开源仿真评测框架Isaac Lab Arena,致力于成为行业评测标准[63][64] 行业瓶颈与解决方案 - 具身智能模型迭代速度极快(几乎每隔一两周),现有学术基准已无法准确评估其能力,行业缺乏有效的规模化评测手段[20][22][23] - 在真实物理环境中测试机器人成本高昂、难以规模化,且存在安全风险,仿真被视作规模化评测具身智能的唯一可行路径[24][27][28][29] - 李飞飞提出的数据金字塔框架中,仿真合成数据被视为最具可扩展性的主干数据形态,是解决数据与评测这一根本约束的关键[31][32][35] - 传统追求“数字孪生”(一比一复刻真实世界)的仿真方式成本极高、无法规模化,行业转向“数字表亲”理念,即追求物理与空间结构可信,细节允许近似[42][43][44][45][46] World Labs与光轮智能的合作细节 - 合作本质是“世界模型×仿真基础设施”的历史性交汇:World Labs解决“世界从哪来”,光轮智能解决“进步怎么被衡量”[3] - 分工明确:Marble负责将环境创建时间从数周压缩到数分钟,解决环境生成的规模问题;光轮智能则承担仿真中最难的部分——提供与真实物理对齐的资产及构建评测闭环[47][49] - 合作旨在构建一个世界、行为、评测高度耦合的闭环系统,使仿真成为一个可重复运行、可持续扩展的数据生产系统,让规模化评测第一次真正成为可能[50][51] - 此次合作有深厚的学术渊源,李飞飞在斯坦福时期推动的BEHAVIOR系列研究及其2025年的BEHAVIOR Challenge,早已为具身智能建立长期、可扩展的评测工程奠定基础[38][40][41] 评测驱动时代的行业意义 - 随着众多大模型公司、机器人本体公司及行业巨头涌入,具身智能路线高度分叉,行业亟需能指引方向的“路标”或“北极星”[65][67][68][69][70] - 好的评测不仅能评估模型能力,更能提前发现技术瓶颈、反向塑造研究方向,是具身智能发展中必须与模型同步扩展的系统级能力[71][72] - 作为仿真与评测基础设施提供商,光轮智能处在所有技术路线之上而非其中,这使其最适合承担客观的行业评测角色[73][74] - World Labs与光轮智能两大关键基建的联手,串联起从环境生成到物理仿真再到规模化评测的全链条,有望推动具身智能行业进入以评测为驱动的新发展阶段[75][76]
李飞飞3D世界模型公测,网友已经玩疯了
具身智能之心· 2025-11-14 09:02
Marble模型核心特点 - 李飞飞创立的World Lab推出全新3D世界生成模型Marble 开启公测 人人可玩[1][3] - 模型支持通过文本 照片 短视频轻松生成可编辑 可下载的专属3D世界 无需专业团队建模[5] - 生成的世界可长久保存 直接下载 支持多种输入方式包括文本 图像 视频 粗略3D布局等[35] 多模态生成与编辑能力 - 支持通过简短文本提示 单图提示生成3D世界 还能通过多张图片 不同视角图片拼接成统一世界[17] - 内置AI原生世界编辑工具 可进行局部编辑如移除物体 修饰区域 也可彻底改变视觉风格或重构大片区域[21] - 针对专业用户推出原生AI工具Chisel 可直接在3D中塑造Marble世界[23] 导出与兼容性 - 提供两种导出方式:导出为高斯散点(最高保真度呈现)和三角形网格(与行业标准工具兼容)[29] - 3D世界可渲染成视频 导出后视频可进行增强 添加细节 去除瑕疵并融入动态元素[31] - 组合模式能将任意数量世界组合起来 构建更广阔空间[27] 技术发展方向 - 未来重点发力交互性 从静态创造转向动态交互 实现与3D世界内元素的实时互动[36][37] - 模型发展方向与李飞飞提出的空间智能三大核心能力一致:生成 多模态 交互[37][40] - 作为World Lab首款商业世界模型产品 Marble代表了世界模型赛道的加速发展[3][34]
李飞飞的世界模型来了,一句话生成3D世界,AI 真的开始理解现实了
36氪· 2025-11-13 19:42
产品发布与核心能力 - 斯坦福教授李飞飞的创业公司World Labs正式推出首款世界模型产品Marble,这是该方向首次以可用产品形式出现 [1] - Marble具备多模态生成能力,可根据一张图片、一段视频或一句文字提示,重建出结构完整、细节丰富的3D世界 [1] - 产品拥有AI原生的世界编辑能力,允许用户对生成的世界进行局部替换、材质变化、光照调整或布局重构 [1] - 支持将生成的世界导出为高斯溅射、三角网格或视频格式,可直接接入Unreal、Unity、Blender等主流创作工具 [1] 技术特点与工作流程 - 支持从文本提示生成3D世界,系统能自动提取关键元素并在几秒钟内生成可漫游的三维空间 [7] - 支持单图生成,能根据照片的透视关系、光线方向和物体摆放方式,将场景自动补齐成可漫游的3D世界 [9] - 提供Chisel工具,允许进阶创作者先搭建粗略的3D框架,再通过文本提示控制最终呈现的风格与氛围 [11] - 将空间逻辑与视觉风格明确区分,同一三维框架可衍生出完全不同的世界 [12] 编辑与扩展功能 - 产品允许用户像处理真实场景一样对生成的三维世界进行删除物体、替换材质、改变光线等调整 [13] - 用户可对初始世界的任意区域进行扩展,系统会根据已有场景逻辑推演并补全环境细节 [13] - 提供“组合模式”,允许将多个独立生成的世界像拼接地图一样组合,以构建规模庞大、层次丰富的虚拟环境 [14] 行业应用与集成 - 支持将场景导出为高斯粒子渲染和三角网格等通用格式,可无缝进入Blender、Maya、Unity、Unreal等主流制作工具 [15][17] - 导出的高质量网格适合用于游戏关卡、动画镜头或建筑展示,碰撞网格则用于物理模拟和机器人路径规划 [16][17] - 支持将整个世界直接渲染成视频,并可进行增强处理,自动补上细腻细节并加入动态效果 [18] 战略意义与未来展望 - Marble的发布象征着空间智能时代的正式开场,其意义远不止让3D创作更方便,而是迈向创造真正具有空间智能的世界模型的第一步 [1][2] - 产品让外界首次清晰感受到AI有可能从理解图像和语言,迈向理解并操控一个由结构、物理与动态规律构成的完整世界 [3] - 未来应用方向包括帮助机器人理解现实环境,以及在科学研究中用于虚拟实验和预测结果 [2][27] - 世界模型需具备生成性、多模态性和交互性三种核心能力,其技术门槛远高于语言模型 [22][23][24][25][26]
李飞飞3D世界模型公测,网友已经玩疯了
量子位· 2025-11-13 13:38
产品发布与市场反响 - 李飞飞创立的World Lab公司发布全新3D世界生成模型Marble,并开启公测,人人可玩[1][3] - 该模型发布后迅速获得好评,用户使用简单,并在社交媒体引发刷屏现象[7][15] - 模型支持通过文本、照片甚至短视频轻松生成可编辑、可下载的专属3D世界,大幅降低使用门槛[4][35] 核心技术功能与特性 - Marble支持通过简短的文本提示、单图提示生成3D世界,并能通过多张图片、不同视角的图片拼接成统一世界[17] - 模型内置AI原生世界编辑工具,可进行局部编辑(如移除物体、修饰区域)或彻底编辑(如交换物体、改变视觉风格、重构大片区域)[21] - 对于专业用户,团队推出原生AI工具Chisel,可直接在3D中塑造Marble世界[23] - 模型支持对已生成世界进行扩展,为特定区域添加细节,并能将任意数量的世界组合起来构建更广阔空间[25][27] 输出格式与兼容性 - 创建的世界可选择两种方式导出:导出为高斯散点(最高保真度呈现形式)或导出为三角形网格(包含低保真碰撞器网格和高质量网格)[29] - 以网格形式导出能使3D世界与众多行业标准工具兼容,便于融入下游项目[29] - 3D世界可渲染成视频,导出后的视频可进行增强,添加细节、去除瑕疵并融入动态元素[31] 战略方向与行业定位 - 作为World Lab首款商业世界模型产品,Marble的核心在于多模态功能的深度落地,支持文本、图像、视频甚至粗略3D布局等多种输入方式[34][35] - 公司未来将重点发力交互性,目标是从静态创造发展到动态交互,实现与3D世界内元素的实时互动[36][37] - 该产品方向与李飞飞强调的空间智能是AI下一个前沿领域的观点一致,旨在打造具备生成、多模态处理和交互预测能力的真正空间智能世界模型[37]