何恺明组三位本科生领衔!持续聚焦Flow模型,突破归一化流生成效率瓶颈
量子位·2025-12-15 12:04
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明团队新作,持续聚焦Flow模型。 论文提出名为 双向归一化流 (BiFlow) 的新框架,通过解耦前向过程——将数据映射为噪声,和逆向过程——把噪声再转回来生成图片, 成功打破了传统归一化流生成模型效率低下的问题。 值得一提的是,论文的三位一作分别是来自清华姚班和MIT的本科生。 BiFlow:逆向过程不必是前向过程的精确逆运算 归一化流方法 (NFs) 已经成为生成建模的一种原则性框架。 标准的归一化流包含前向过程和逆向过程: 与MeanFlow对流匹配的优化不同,这次主要旨在解决归一化流在生成模型中的局限。 前向过程将数据映射为噪声,逆向过程则通过对前向过程求逆来生成样本。 传统的NF模型有一个硬性规定,逆向过程必须是前向过程的精确逆运算——要像钥匙和锁一样完全匹配。这就导致了两个问题: BiFlow的核心创新就在于, 打破了"逆向过程必须是前向过程的精确逆运算"这一规则 。 设计思路是这样的: BiFLow解耦了前向过程和逆向过程的设计。 模型设计受限:因为要保证 "可逆",不能使用很多强大的通用架构 (比如视觉Transformer) ,得特 ...