Workflow
FAST动作编码技术
icon
搜索文档
π0-FAST正式集成到LeRobot中!pytorch版本来了
具身智能之心· 2026-01-15 08:32
模型技术概览 - π0-FAST是一款融合了视觉语言模型能力与FAST(频域动作序列分词)动作编码技术的新型模型 [1] - 该模型使自回归视觉语言动作模型能够训练高精度操作任务,这是传统方法无法实现的 [1] - 相比π0等扩散模型方法,其训练速度提升高达5倍 [1] 技术方案与优势 - 传统机器人动作编码方法(如按维度、按时间步分箱方案)在处理需要精确控制和高频响应的复杂灵巧技能任务时会迅速失效 [3] - π0-FAST通过信号处理方法压缩动作序列,生成可自回归预测的密集动作词元序列,其预测方式与语言词元完全一致,从而解决了传统方法的难题 [4] - 原版π0-FAST实现仅支持JAX框架,本次已用PyTorch进行了重构,包含了交叉熵损失目标、FAST分词方案以及KV缓存等推理优化技术 [6] 框架集成与生态 - π0-FAST目前已集成到LeRobot框架中 [2] - LeRobot框架现已支持π0、π0.5、π0-fast系列模型,此外国产模型WALL-OSS也被集成进去 [7] - 相关文档和基础检查点已公开,文档位于Hugging Face,基础检查点为`lerobot/pi0fast-base` [9]