Workflow
视觉生成的另一条路:Infinity 自回归架构的原理与实践
AI前线·2025-10-31 13:42

自回归模型和 Scaling Law 作者 | 韩剑 审校|罗燕珊 策划 | AICon 全球人工智能开发与应用大会 以 ChatGPT、DeepSeek 为代表的大语言模型取得了巨大的成功,掀起了全球新一轮 AI 浪潮。 但是在视觉生成领域,目前主流的方法却是一直以扩散模型为主导。与大语言模型采取相同技术 路线的视觉自回归方法因为具有更好的 scaling 特性,能够统一理解 & 生成任务,隐藏着巨大的 潜力,正受到人们越来越多的重视。 本文整理自字节跳动商业化技术 AIGC 算法工程师韩剑 6 月份在 AICon 2025 北京站的分享 《Infinity:视觉自回归生成新路线》。本次演讲以被选为 CVPR 2025 Oral 的工作 Infinity 为 例,详细介绍自回归视觉生成的底层技术原理。并以图像生成和视频生成两个具体场景,分享最 新的研究成果和相关思考。 12 月 19~20 日的 AICon 北京站 将以 "探索 AI 应用边界" 为主题,聚焦企业级 Agent 落地、上 下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实 际应用案例,邀请来自头部企业、 ...