Marble产品核心能力 - World Labs发布首款可商用生成式多模态世界模型Marble,相较于两个月前的预览版,支持更多模态输入且生成的3D世界更丰富细致[2] - 核心能力是通过文本、单张图片、多张图片或视频直接生成完整、可探索的3D世界,并能“脑补”出描述中未提及或图片中不可见的细节[5][6][10][13] - 提供多图像输入功能,可将不同角度拍摄的照片无缝拼接融合成统一3D空间,使生成场景更贴近创作者构想[13][14] - 内置AI编辑工具,支持局部微调(如移除物体)和全局调整(如改变艺术风格或场景结构)[18][20] - 提供实验性工具Chisel,允许高级用户将世界“结构”和“风格”分离,实现对空间布局的精细控制[21] - 通过“扩展”模式自动生成更多内容扩大世界边界,或通过“组合”模式将多个独立世界拼接成复杂宏大场景[22][26] - 支持以Gaussian Splats(最高保真度)、三角网格(兼容Unity、Unreal Engine等)及视频(可添加动态元素)多种格式导出[23][24] 目标市场与商业模式 - 针对普通用户和专业用户分别提供免费版和Pro版,Pro版主要面向游戏开发、电影特效、建筑设计及机器人研究等领域的专业人士[8] 空间智能行业前景 - 李飞飞提出空间智能是人工智能的下一个前沿方向,将重塑叙事、创意、机器人学及科学发现等领域[27][29] - 当前最先进的多模态模型在物理世界中能力笨拙,表现为估算距离/方向/大小任务表现略高于随机水平、缺乏空间想象力、生成视频内容缺乏连贯性[33][35][36][37] - 空间智能能大幅降低3D世界创造门槛,赋能普通人及专业人士快速创建迭代虚拟世界,是实现具身智能让机器人理解并与物理世界安全互动的前提[41] - 该技术能在科学研究、医疗、教育等领域处理超越人类直观感知的复杂空间问题,如模拟实验及探索人类难以到达的环境[42] - 构建空间智能比训练语言模型困难得多,需要新算法及处理更复杂数据[44]
创业一年后,李飞飞推出首款可商用世界模型 Marble,任意模态都可生成 3D 世界
Founder Park·2025-11-13 22:06