Workflow
扩散语言模型(DLMs)
icon
搜索文档
最新综述!扩散语言模型全面盘点~
自动驾驶之心· 2025-08-20 07:32
点击下方 卡片 ,关注" 大模型之心Tech "公众号 >> 点击进入→ 大模型技术 交流群 本文只做学术分享,如有侵权,联系删文 写在前面 在生成式AI的竞技场上,两大技术范式—— 扩散(Diffusion)模型 与 自回归(autoregressive, AR)模型 ——的角逐从未停止。 一边是凭借 图像生成 惊艳世界的 扩散模型 ,以Stable Diffusion和DALL·E为代表,通过"从噪声中迭代重建"的生成逻辑刷新了视觉创作的边界。 另一边则是统治 文本生成 领域的 自回归模型 ,以GPT、LLaMA、Qwen、DeepSeek系列为代表的 大语言模型 ,凭借"逐词预测序列"的连贯性成为 语言任务的默认框架。 然而,自回归范式的固有缺陷已成为行业痛点—— 生成速度受限于序列依赖 ,即便是千亿参数模型也难以突破「一个token接一个token」的效率瓶 颈。 而如今,一种全新的范式正在改写规则: 扩散语言模型(Diffusion Language Models, DLMs) 凭借「并行生成+迭代优化」的特性,在实现数倍推 理加速的同时,性能已比肩同等规模AR模型,成为大语言模型领域最具潜力的突破 ...