Workflow
计算机视觉和图形学
icon
搜索文档
扩散模型还原被遮挡物体,几张稀疏照片也能"脑补"完整重建交互式3D场景|CVPR'25
量子位· 2025-04-23 12:50
DP-Recon团队 投稿 量子位 | 公众号 QbitAI 你是否设想过,仅凭几张随手拍摄的照片,就能重建出一个完整、细节丰富且可自由交互的3D场景? 在传统方法中,这几乎是不可能完成的任务,稀少的拍摄视角往往导致模型无法还原被遮挡的区域,生成的场景要么残缺不全,要么细节模 糊。更令人困扰的是,传统的重建算法无法解耦场景中的独立物体,重建结果无法交互,严重限制了在具身智能、元宇宙和影视游戏等领域的 应用前景。 近期, 北京通用人工智能研究院 联合清华大学、北京大学的研究团队提出了名为 DP-Recon的创新方法 。该方法通过在组合式3D场景重建 中,引入生成式扩散模型作为先验,即便只有寥寥数张图像输入,也能智能"脑补"出隐藏在视野之外的场景细节,分别重建出场景中的每个物 体和背景。 值得一提的是,该方法还创新性地提出了一套可见性建模技术,通过动态调节扩散先验和输入图片约束的损失权重,巧妙地解决了生成内容与 真实场景不一致的难题。在应用层面,DP-Recon不仅支持从稀疏图像中恢复场景,还能实现基于文本的场景编辑,并导出带纹理的高质量模 型,为具身智能、影视游戏制作、AR/VR内容创作等领域,带来了全新的可能 ...