多模态生成式世界模型
搜索文档
周末来造梦!李飞飞世界模型正式开放,能力升级,有免费版
机器之心· 2025-11-13 16:26
产品发布与定位 - 李飞飞“空间智能”团队正式向公众全面开放其先进的多模态生成式世界模型Marble [3] - 产品定位为实现“人人可用、随手造世界” [3] - 相较于两个月前的预览版,此次全面开放版本实现了能力跃升式升级 [4] 产品能力与技术特点 - 核心升级在于“重度多模态”输入能力,支持文本、单张图像、多图提示等多种输入方式,允许用户通过多源信息对世界进行精细约束与设计 [7] - 提供AI原生世界编辑工具,支持对象移除/替换、局部修饰、视觉风格调整、结构性重构等局部与大范围修改,使创作进入可迭代模式 [11][12] - 新能力Chisel实现了结构与风格的解耦,用户可通过基础3D形状或导入3D资产搭建粗略结构,再通过文本提示决定整体风格,为世界生成带来全新控制维度 [14][15][17][18][20][21] - 支持生成后对指定区域进行一键扩展,以填充缺失区域、修补边缘瑕疵并补充细节 [22][23][24] - 可通过“作曲模式”将多个世界按自定义关系拼接,构建大规模空间 [25] 输出格式与应用场景 - 创建的世界支持以多种格式导出,便于整合到下游项目或专业工具链中 [26] - Gaussian Splat是最高保真度的输出方式,能输出极细腻的空间细节,并可通过开源渲染器在浏览器中直接渲染 [27] - 支持导出为三角网格,可与游戏引擎、建模软件、影视制作工具等行业标准工具无缝兼容 [28] - 支持将世界直接渲染为视频,并可实现像素级的镜头控制 [31][32] - 支持对导出的视频进行AI增强 [33] - 产品更适用于游戏开发、影视特效、建筑设计、机器人仿真等专业场景 [4] 商业模式与生态建设 - 目前提供免费版与会员版,主要差异体现在可生成的世界数量、可使用的编辑功能范围与深度以及是否具备商用授权 [6] - 公司同步推出Marble Labs,旨在与艺术家、设计师、工程师合作探索更多可能性,提供创作范式与最佳实践参考 [35][36] 未来发展方向 - Marble被视为迈向“空间智能”的阶段性成果,未来将重点强化交互性,使人类与智能体能在生成世界中更自然地感知、行动与学习,拓展在模拟与机器人领域的应用边界 [37]