3D世界构建
搜索文档
Meta再推WorldGen,一句话「盖」出50×50米一座城
具身智能之心· 2025-11-25 08:03
文章核心观点 - Meta公司推出名为WorldGen的突破性生成式AI系统,能够仅通过一段文本提示生成完整、可交互、可导航的3D世界,覆盖面积达50x50米,并在整个区域内保持风格和几何结构的一致性[12][13][19] - 该技术融合了程序化推理、扩散模型3D生成以及面向对象的场景分解,代表了生成式AI从2D内容创作向复杂3D环境构建的重大跨越[13][17] - WorldGen的输出可直接兼容Unity、Unreal等主流游戏引擎,无需额外转换,展示了在游戏开发、仿真和沉浸式社交环境等领域的巨大应用潜力[22][29] 技术方法与创新 - 系统采用多阶段流程:规划(程序化blockout生成、导航网格提取)、重建(图像到3D基础模型)、分解(场景部件提取)、精修(网格与纹理优化)[21] - 与基于Gaussian Splatting等技术(如World Labs的Marble)相比,WorldGen以网格为基础输出几何结构,原生支持物理模拟、碰撞检测和导航,功能性更强[29] - 传统方法通常从单一视角向外扩展,移动3-5米后质量骤降,而WorldGen能生成50x50米完整纹理化场景并保持一致性[18][19] 应用前景与行业影响 - 该技术有望大幅降低3D内容制作门槛,使普通人无需编写代码即可从文本提示创建虚拟世界,推动内容创作大众化[22][30] - 对游戏开发、技术美术和关卡设计师等工作流程将产生变革,从业者可从手动建模转向使用AI提示词驱动并筛选编辑输出[30][31] - 生成过程算力需求较高,开发者需评估本地与云端渲染能力以确定合适部署方式[31] 当前状态与发展方向 - WorldGen目前仍处于研究阶段,尚未对开发者开放,但已展示出跨行业节省时间和成本的潜力[22] - 未来版本计划支持更大规模世界生成并降低生成延迟,进一步提升实用性[20][22]
Meta再推WorldGen,简单一句话,竟「盖」出50×50米一座城
机器之心· 2025-11-22 12:12
文章核心观点 - Meta发布名为WorldGen的突破性研究,能够仅通过一段文本提示生成可导航、可交互的完整3D世界,将生成式AI的应用从图像和视频向前推进了一大步 [11][12] - 该技术基于程序化推理、扩散模型和面向对象的场景分解,生成几何结构一致、视觉效果丰富的3D场景,覆盖面积达50米x50米,并能在整个区域保持风格与几何的一致性 [12][18][27] - WorldGen的产出可直接兼容Unity、Unreal等主流游戏引擎,无需额外转换,展示了在游戏、仿真和沉浸式社交环境中节省时间和成本的巨大潜力,推动3D内容创作走向大众化 [21][28] 技术方法与优势 - WorldGen是一个端到端系统,主要流程包括规划、重建、分解和精修四个阶段,首先生成3D场景的图像,再进行图像到3D的重建 [16][22] - 与基于Gaussian Splatting等技术的方法相比,WorldGen以网格为基础输出几何结构,使其成为面向功能开发的工具,原生支持物理模拟、碰撞检测和导航,而不仅用于渲染视觉内容 [27] - 该技术克服了其他方法从单一视角扩展导致移动3到5米后质量迅速下降的短板,能够生成完整纹理化的大规模场景 [17][18][27] 应用前景与影响 - 该技术有望彻底改变3D内容制作复杂耗时的传统工作流,为技术美术和关卡设计师等工作带来变革,从业者将从手动操作转向使用提示词驱动AI并进行筛选编辑 [21][28][29] - 生成内容可直接用于游戏引擎,但生成过程对算力需求高,开发者需评估本地与云端渲染能力以决定合适部署方式 [21][29] - 此项研究目前仍处于研究阶段,尚未对开发者开放,但未来计划支持更大规模的世界生成并降低生成延迟 [19][21]