腾讯混元3D世界模型1.0发布 - 公司正式发布并开源混元3D世界模型1.0,这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型 [1] - 该模型融合全景图像合成与分层3D重建技术,支持文字和图片输入,几分钟内即可生成高质量、风格多样的可漫游3D场景 [1] - 过去需要专业建模团队数周才能完成的3D虚拟世界构建,现在大幅简化 [1] 技术特点与创新 - 采用"语意层次化3D场景表征及生成算法",将复杂3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离 [9] - 输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具 [9] - 在文生世界、图生世界的美学质量和指令遵循能力等关键维度全面超越当前SOTA开源模型 [13] 应用场景 - 游戏开发:极大简化3D场景构建流程,输入简单指令即可快速生成包含建筑、地形、植被的完整3D场景 [3] - VR应用:生成的场景可无缝导入Vision Pro等虚拟头显,带来沉浸式体验 [7] - 数字内容创作:普通用户无需建模经验,通过一句话或一张图即可快速生成360°沉浸式视觉空间 [7] 模型生态与开源计划 - 除3D模型外,公司还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划 [1] - 将在月底开源0.5B、1.8B、4B、7B混合推理模型,以及多模态理解模型混元-large-vision和游戏视频生成框架混元GameCraft [16] - 混元3D系列模型社区下载量超过230万,已成为全球最受欢迎的3D开源模型 [18] 模型性能与行业地位 - 混元3D 2.5模型质感大幅提升,在上海人工智能实验室6月评测中排名全球第一 [16] - 全球首个AI设计智能体Lovart已首选调用混元3D模型的API接口 [16] - 知名3D打印公司拓竹科技旗下的模型平台MakerWorld也已接入混元3D模型 [16] 基座模型进展 - 混元旗舰模型TurboS保持每月一个版本的快速迭代,在全球大模型权威排行榜上稳居前列 [13] - 混元T1综合能力国内领先,在项目级代码生成、高难度数学推理、文本写作等方面表现突出 [14] - 多模态理解模型混元Vision在LMArena Vision全球榜单中获得国内榜首,中文能力稳居全球第一梯队 [14]
腾讯混元亮相WAIC 2025,发布3D世界模型及系列开源模型