ART(Agent Reinforcement Trainer)
搜索文档
 强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
 量子位· 2025-08-07 18:13
 强化学习框架MCP·RL   - 科技公司OpenPipe推出全新开源强化学习框架MCP·RL,专注于LLM+RL结合[2]   - 该框架只需提供MCP Server地址,agent即可自动发现工具、生成任务并通过强化学习闭环反馈优化策略[3]   - 在2/3的基准测试中达到或超越SOTA性能[4]     传统MCP流程痛点   - 传统MCP需人工配置完整工作流(数据准备、工具注册、prompt编写)[8]   - 需设置回退逻辑且功能增多时配置量呈指数级上升[9][10]   - 用户需完全掌握任务拆分、工具调用及逻辑设计能力[11][12][13]     MCP·RL技术突破   - 实现"做中学"模式:自动发现工具、生成任务、实战训练及策略优化[16][18]   - 训练流程四步走:工具发现→任务生成→实战训练→测试泛化[18][25]   - 无需人工标注数据,适配任意Server且开箱即用[23]     应用效果与案例   - ART框架对Qwen 2.5-14B强化训练后,在电子邮件检索任务中超越o3达到SOTA[26]   - 网友评价其实现从"AI调用MCP工具"到"AI利用MCP"的范式转变[20][21]     技术背景与扩展   - 基于OpenPipe的ART系统(Agent Reinforcement Trainer),核心为LLM经验学习机制[24]   - ART可集成GRPO至Python应用,通过RULER评估策略实现参数优化[24][25]