产品发布与核心能力 - 斯坦福教授李飞飞的创业公司World Labs正式推出首款世界模型产品Marble,这是该方向首次以可用产品形式出现 [1] - Marble具备多模态生成能力,可根据一张图片、一段视频或一句文字提示,重建出结构完整、细节丰富的3D世界 [1] - 产品拥有AI原生的世界编辑能力,允许用户对生成的世界进行局部替换、材质变化、光照调整或布局重构 [1] - 支持将生成的世界导出为高斯溅射、三角网格或视频格式,可直接接入Unreal、Unity、Blender等主流创作工具 [1] 技术特点与工作流程 - 支持从文本提示生成3D世界,系统能自动提取关键元素并在几秒钟内生成可漫游的三维空间 [7] - 支持单图生成,能根据照片的透视关系、光线方向和物体摆放方式,将场景自动补齐成可漫游的3D世界 [9] - 提供Chisel工具,允许进阶创作者先搭建粗略的3D框架,再通过文本提示控制最终呈现的风格与氛围 [11] - 将空间逻辑与视觉风格明确区分,同一三维框架可衍生出完全不同的世界 [12] 编辑与扩展功能 - 产品允许用户像处理真实场景一样对生成的三维世界进行删除物体、替换材质、改变光线等调整 [13] - 用户可对初始世界的任意区域进行扩展,系统会根据已有场景逻辑推演并补全环境细节 [13] - 提供“组合模式”,允许将多个独立生成的世界像拼接地图一样组合,以构建规模庞大、层次丰富的虚拟环境 [14] 行业应用与集成 - 支持将场景导出为高斯粒子渲染和三角网格等通用格式,可无缝进入Blender、Maya、Unity、Unreal等主流制作工具 [15][17] - 导出的高质量网格适合用于游戏关卡、动画镜头或建筑展示,碰撞网格则用于物理模拟和机器人路径规划 [16][17] - 支持将整个世界直接渲染成视频,并可进行增强处理,自动补上细腻细节并加入动态效果 [18] 战略意义与未来展望 - Marble的发布象征着空间智能时代的正式开场,其意义远不止让3D创作更方便,而是迈向创造真正具有空间智能的世界模型的第一步 [1][2] - 产品让外界首次清晰感受到AI有可能从理解图像和语言,迈向理解并操控一个由结构、物理与动态规律构成的完整世界 [3] - 未来应用方向包括帮助机器人理解现实环境,以及在科学研究中用于虚拟实验和预测结果 [2][27] - 世界模型需具备生成性、多模态性和交互性三种核心能力,其技术门槛远高于语言模型 [22][23][24][25][26]
李飞飞的世界模型来了,一句话生成3D世界,AI 真的开始理解现实了
36氪·2025-11-13 19:42