何恺明CVPR 2025报告深度解读:生成模型如何迈向端到端?
自动驾驶之心·2025-06-28 21:34
点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我 -> 领取大模型巨卷干货 写在前面 在深度学习的历史长河中,AlexNet的横空出世曾彻底改写识别模型的命运——它让"逐层训练"成为过去式,端到端学 习从此一统江湖。而今天,当我们望向生成模型的浩瀚星空,扩散模型的多步迭代、自回归模型的时序依赖,是否仍 在重演"前AlexNet时代"的困局? 何恺明老师在 CVPR 2025 workshop上的最新分享 《Towards End-to-End Generative Modeling》 ,正以手术刀般的视 角剖开这场技术演进的历史轮回。他不仅回溯了识别与生成的"硬币双面"关系——一边是数据到语义的抽象流,一边 是噪声到实例的具象流,更带来了MeanFlow这把"瑞士军刀":用平均速度替代复杂积分,让ImageNet生成从250步迭 代压缩到1步完成,FID指标直逼传统多步模型的天花板。 这不禁让人思考:生成模型的"AlexNet时刻"是否已至? 今天,就让我们以何恺明老师的报告为锚点, 回顾 一下生成模型技术丛林的深度漫游,解锁那些正在重塑生成模型范 式的关键思想。 此外,借着这个话题,我们也同步 ...