端到端自主决策

搜索文档
通往AGI的快车道?大模型驱动的具身智能革命 | Jinqiu Select
锦秋集· 2025-09-01 23:29
具身智能长期被视为通往通用人工智能(AGI)的关键路径。它让智能体在部分场景下逐步具备"感知—决策—行动"的闭环雏形,从而能够在真实世界中探索、学 习并完成更复杂的任务。随着大模型在多模态推理与生成能力上的突破,这一领域正进入快速演进阶段。 如今,VLA 模型已能在特定任务中实现语言与视觉信息到动作输出的映射,世界模型也为智能体提供了相对精确的内部环境模拟,使它们能够在虚拟空间中不断演 练与优化策略。这些进展让具身智能比以往任何时候都更接近实现关键性的提升。 本文编译自 电子科技大学团队 的最新全面综述《Large Model Empowered Embodied AI: A Survey on Decision-Making and Embodied Learning》 (arXiv:2508.10399v1),旨在为读者系统梳理大模型赋能具身智能的最新进展。 文章全面综述了由大模型驱动的具身智能研究。文章深入探讨了大模型如何赋能智能体的自主决策,具体涵盖了 分层决策中的高层规划、底层执行与反馈 ,以及 端到端 范式 中的视觉-语言-行动(VLA)模型 。 在具身学习方面,文章重点阐述了大模型如何深度增强 ...