Workflow
TransDiffuser: 理想VLA diffusion出轨迹的架构
理想TOP2·2025-05-18 21:08

Diffusion(扩散模型)是一种生成数据的模型,除了Diffusion外,还有其他生成模型,比如GAN(生成对 抗网络)、VAE(变分自编码器)等。不同的生成模型在核心思想与生成数据的方法上有区别。 Diffusion的核心思想是通过加噪声(Forward Process)和去噪(Reverse Process)的过程来学习数据的分 布。可以想象成一种逆向拼图: 先把一张完整的图片或其他数据打乱成一片模糊,再通过学习如何一 步步还原它。 去噪的过程是训练一个神经网络,让它去预测每一步的噪声,然后去除噪声,生成目标数据。 贾鹏25年3月英伟达GTC上关于理想VLA diffusion出轨迹的表述 VLM是由端到端+VLM两个模型组成的,VLM的两个快慢系统都是输出的轨迹。VLA是一个模型具 备快慢思考能力。 读者不用被里面的名词吓着,本文经过认真思考,并结合预期的大多数读者的知识储备,做了不少专 门解释,逻辑链很清晰,多读几遍能有收获的。 本文结构:先解释什么是Diffusion,再分享贾鹏25年3月英伟达GTC上关于理想VLA diffusion出轨迹 的表述,最后分享TransDiffuser的架构细节 ...