Chain-of-Frame（CoF） - 财报，业绩电话会，研报，新闻 - Reportify

Chain-of-Frame（CoF）

搜索文档

视频模型真在推理，还是「表演」推理？港中文等质疑：Chain-of-Frame是真的吗？

机器之心· 2025-11-19 02:19

近年来，以 Veo、Sora 为代表的视频生成模型展现出惊人的合成能力，能够生成高度逼真且时序连贯的动态画面。这类模型在视觉内容生成上的进步，表明其内部可能隐含了对世界结构与规律的理解。更令人关注的是，Google 的最新研究指出，诸如 Veo 3 等模型正在逐步显现出超越单纯合成的 "涌现特性"，包括感知、建模和推理等更高层次能力。这催生出一个与语言模型 "思维链"（Chain-of-Thought, CoT）相对应的新概念 ——Chain-of-Frame（CoF）。其核心思想是：模型通过逐帧生成视频，以连贯的视觉推演方式逐步解决问题。然而，一个关键疑问仍未解决：这些模型是否真正具备零样本推理（Zero-Shot Reasoning）的能力？抑或它们只是在模仿训练数据中出现过的表面模式？为探究这一问题，来自香港中文大学、北京大学、东北大学的研究团队进行了系统性研究，对 Veo 3 等模型的零样本推理潜力进行了深入评估，并提出了涵盖空间、几何、物理、时间等 12 个推理维度的综合测试基准 ——MME-CoF。论文题目：Are Video Models Ready as Zero-Shot R ...

Chain-of-Frame（CoF）

零样本推理（Zero-Shot Reasoning）

Artificial Intelligence

Chain-of-Frame（CoF）

零样本推理（Zero-Shot Reasoning）

Artificial Intelligence