Workflow
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统

腾讯混元3D世界模型1.0发布 - 腾讯在2025年世界人工智能大会(WAIC)上正式发布混元3D世界模型1.0 这是首个开源且兼容传统CG管线的可漫游世界生成模型 [1] - 模型可通过腾讯混元3D生成引擎体验 海内外均可使用 正式开源后也可在Hugging Face等开源社区下载模型本地部署 [2] 技术突破与核心优势 - 模型融合视频驱动和三维驱动两类方法优势 解决现有技术缺乏3D一致性、数据稀缺等问题 [3][4] - 三大核心优势:360°沉浸体验、工业级兼容性、原子级交互 支持文本或图像输入生成可探索3D场景 [5][6] - 采用生成式架构 结合全景图像合成与分层3D重建技术 实现高质量可漫游3D场景生成 [7] 关键技术实现 - 全景世界代理生成基于扩散变换器(DiT)框架 支持文本和图像输入 [11][12][13] - 引入高程感知增强和环形去噪策略 解决几何畸变和边界不连续问题 [16][17] - 提出语义层次化3D场景表征及生成算法 实现前景与背景智能分离 [21][22] - 采用深度估计模型和跨层深度匹配技术 确保几何连贯性 [23] 应用场景 - 支持VR应用 生成360°无缝覆盖环境 可部署至Apple Vision Pro等主流VR平台 [36] - 游戏开发应用 生成3D网格世界可导出为标准格式 无缝集成Unity和Unreal Engine [37] - 物体编辑应用 支持对单个元素进行精确3D操控 适用于建筑预览等领域 [38] - 物理仿真应用 导出的分层网格兼容主流物理引擎 支持碰撞检测等真实世界行为仿真 [39] 性能表现 - 文生360°全景指标表现优异:BRISQUE(40.8)、NIQE(5.8)、Q-Align(4.4)、CLIP-T(24.3) 优于同类模型 [19] - 支持长距离世界探索 提出基于视频生成的视图补全模型Voyager 实现空间一致的世界拓展 [30][32][33]