华为世界模型来了,单卡30分钟生成272㎡场景
36氪·2025-10-28 15:32
技术突破与核心能力 - 推出世界模型WorldGrow,能生成1800平方米(19x39块)超大室内场景,单张A100显卡30分钟可生成约272平方米场景 [1][11] - 生成场景具备连贯的几何拓扑和照片级真实感外观,虚拟人可在复杂空间布局中自主规划路径并顺畅导航 [3] - 采用三步核心技术:数据精准预处理、3D块无缝拼接机制、粗到精生成策略,有效解决传统方法导致的物体变形、纹理断裂、布局不合理及扩展性差等问题 [5][7][9] 性能优势与效率表现 - 在3D-FRONT数据集上,几何重建指标MMD(CD为0.97x10²,EMD为13.33)和COV(CD为51.82%,EMD为46.56%)达到SOTA水平,FID指标低至7.52,显著优于SynCity、BlockFusion等主流方法 [10][12] - 生成效率是同类技术的6倍,扩展至7×7块超大场景时边缘质量仍保持稳定 [10][11] - 在10×10区块场景生成对比中,其MMD(CD为0.96x10²,EMD为12.83)和COV(CD为48.99%,EMD为48.18%)指标表现优异,FIDT为5.43 [11] 研发背景与合作机构 - 该研究由华为联合上海交通大学、华中科技大学共同完成,论文第一作者为上海交通大学的Sikuang Li和Chen Yang [13] - 研究完成于作者在华为实习期间,通讯作者为华为终端BG首席科学家、国际欧亚科学院院士田奇 [13]