多视角图像生成

搜索文档
上海期智&清华!BEV-VAE:首个自监督BEV视角的VAE,从图像到场景生成跃迁~
自动驾驶之心· 2025-07-08 20:45
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 论文作者 | Zeming Chen等 今天自动驾驶之心为大家分享 上海期智研究院&清华大学赵行老师团队 最新的工 作! BEV-VAE:实现自动驾驶环视图像精准生成与操控。 如果您有相关工作需要 分享,请在文末联系我们! 自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一 步咨询 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文链接: https://arxiv.org/abs/2507.00707 代码仓库 (Github): https://github.com/Czm369/bev-vae 动机 编辑 | 自动驾驶之心 摘要 在自动驾驶中,多视角图像生成任务需要在不同相机视角下实现对三维场景的一致理解。然而,大多数现 有方法将其简化为二维图像集合的生成问题,缺乏对三维结构的显式建模。我们认为,对于自动驾驶场景 的生成任务,结构化表示至关重要。为此,本文提出 BEV-VAE 方法,实现具有空间一致性与可控性的多视 角图像生成。BEV-VAE 首先训练一个多视角图像 ...