无训练可控生成

搜索文档
CVPR 25 |全面提升视觉感知鲁棒性,生成模型快速赋能三维检测
机器之心· 2025-05-23 12:17
论文第一作者林宏彬来自香港中文大学(深圳)理工学院的Deep Bit 实验室、深圳市未来智联网络研究院,导师为李镇老师。目前实验室的研究方向包括:自动驾 驶、医学成像和分子理解的多模态数据分析和生成等。 论文标题: DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation 论文链接: https://www.arxiv.org/abs/2503.11122 GitHub: https://github.com/Hongbin98/DriveGEN 任务背景 随着新能源汽车产业的持续发展,智能驾驶辅助技术的应用越来越广泛。其中,基于纯视觉的自动驾驶方案只需使用多视角图像进行环境感知与分析,具有 成本低、效率高的优势,因而备受关注。然而在实际应用中,视觉感知模型的泛化能力至关重要。 来自香港中文大学(深圳)等单位的学者们提出了一种名为 DriveGEN 的无训练自动驾驶图像可控生成方法。该方法无需额外训练生成模型,即可实现训 练图像数据的可控扩充,从而以较 ...