AAAI 2026|教会视频扩散模型「理解科学现象」:从初始帧生成整个物理演化
机器之心·2025-11-15 09:37
上述问题的根源在于,这些模型缺乏对科学规律的内在理解。它们学习到的只是像素分布,而非支配这些分布的动力学方程。更糟的是,科学数据具有稀缺性, 且缺少语言描述(不像 "a dog is running" 那样易于提示), 导致传统 "文本提示 — 图像生成" 范式在科学 视频生 成任务中失效 。 近年来,Stable Diffusion、CogVideoX 等视频生成模型在自然场景中表现惊艳,但面对科学现象 —— 如流体模拟或气象过程 —— 却常常 "乱画":如下视频所示, 生成的流体很容易产生违背物理直觉的现象,比如气旋逆向旋转或整体平移等等。 现有的视频扩散模型与本文新方法的生成效果对比 因此,在扩散模型不断重塑视觉生成的今天,一个全新的问题正在浮现: 当 AI 可以生成炫丽的自然视频时,是否也能推演 "真实的科学现象" 这正是来自东方理工与上海交大的研究团队在最新研究中提出的挑战。他们在一篇新论文中,提出了一种让视频扩散模型学习 "潜在科学知识" 的全新框架, 使模 型在给定一帧初始图像的情况下,可以生成更为贴近物理规律的科学现象演化过程 —— 例如流体运动、台风路径、湍流结构等。 论文标题: Laten ...