CVPR 2025奖项总结 青年学者奖 - 谢赛宁以一作身份与何恺明合作完成ResNeXt并参与MAE,均为计算机视觉领域影响深远的工作[4] - 苏昊是李飞飞的博士生,曾参与计算机视觉领域知名项目ImageNet[3] 最佳论文奖 - 获奖论文《VGGT: Visual Geometry Grounded Transformer》由Meta和牛津大学联合提出,首次实现单次前馈端到端预测完整3D场景信息[5] - VGGT基于Vision Transformer,采用交替"全局-帧内"自注意力机制,性能超越现有几何或深度学习方法[13][17] - 模型输入支持1-200张图像,输出包含相机参数、深度图、点云图等核心3D属性[15] 最佳学生论文 - 获奖论文《Neural Inverse Rendering from Propagating Light》提出基于物理模型的神经逆向渲染方法,可从LiDAR数据重建场景几何和材质[25][26] - 核心技术包括时间分辨辐射缓存和神经网络加速计算,应用于自动驾驶和虚拟现实领域[27][29] 最佳论文荣誉奖 MegaSaM - 提出改进的深度视觉SLAM系统,能处理动态场景的单目视频,在相机姿态和深度估计方面优于传统方法[32][33] Navigation World Models - LeCun团队开发的可控视频生成模型,能基于视觉观测和导航动作预测未来画面,采用条件扩散变换器技术[38][39] Molmo and PixMo - 72亿参数视觉-语言模型Molmo超越Claude 3.5 Sonnet等闭源模型,配套数据集PixMo完全独立于闭源模型生成[45][48] 3D Student Splatting and Scooping - 改进3D高斯泼溅技术,采用Student's t分布实现正负密度建模,组件数量最多减少82%仍保持质量[53][56]
谢赛宁苏昊CVPR25获奖!华人博士王建元一作拿下最佳论文
量子位·2025-06-14 00:44