CVPR 2026 Workshop征稿｜从感知到推理，ViSCALE 2.0 邀你重塑计算机视觉的 System 2

研讨会核心信息 - 第二届计算机视觉推理扩展研讨会（ViSCALE 2026）将于2026年6月在美国举办，由来自清华大学、普林斯顿大学、加州大学圣克鲁兹分校、新加坡国立大学等全球顶尖机构的学者联合举办 [2] - 研讨会旨在汇聚全球顶尖学者，共同探索如何让视觉模型通过计算扩展突破现有模型的能力瓶颈 [2] - 研讨会将采用线上线下混合模式，于2026年6月3日或4日举行，会期为半天 [9] 研讨会核心观点与研究方向 - 研讨会认为计算机视觉正站在新范式的路口，其发展路径是从单纯的像素感知，到构建符合物理规律的世界模型；从平面的模式识别，到复杂的空间推理 [2] - 研讨会关注的重点是深度推理，旨在探索模型如何在测试时动态分配计算资源，实现从“看懂画面”到“模拟世界”的跃迁，而非上一代模型的“直觉反应” [5] - 核心研究方向包括：利用测试时计算扩展提升视频生成的物理一致性与长时序因果推理能力；突破2D限制，让模型在3D空间中具备类似人类的导航与操作直觉；发展视觉思维链，让视觉模型学会反思、自我修正与多步推理；探索测试时计算量与视觉推理性能之间的扩展规律 [6] 研讨会征稿详情 - 研讨会寻求能打破现有视觉模型天花板的原创性研究，鼓励新颖观点和创意思路，接受多种类型投稿 [7] - 征稿分为两个方向：Track 1为正式论文，属于存档类型，篇幅限制为8页（不含参考文献）；Track 2为扩展摘要，属于非存档类型，篇幅限制不超过4页（不含参考文献） [9] - 投稿需使用CVPR 2026 Author Kit格式，截止日期为2026年3月10日，录用通知将于2026年3月18日发出 [9] - 具体征稿议题包括但不限于：测试时计算扩展的理论基础与高效算法、世界模型/视频生成/复杂决策中的推理扩展、具身智能与自动驾驶中的长时序空间推理、统一模型中的推理扩展问题、视觉思维链与模型可解释性、推理扩展带来的安全性/鲁棒性与幻觉问题 [9]