MCP·RL - 财报，业绩电话会，研报，新闻 - Reportify

MCP·RL

搜索文档

强化学习+MCP=王炸？开源框架教AI在MCP中玩转工具解决任务，实测效果超越GPT！

量子位· 2025-08-07 18:13

强化学习框架MCP·RL - 科技公司OpenPipe推出全新开源强化学习框架MCP·RL，专注于LLM+RL结合[2] - 该框架只需提供MCP Server地址，agent即可自动发现工具、生成任务并通过强化学习闭环反馈优化策略[3] - 在2/3的基准测试中达到或超越SOTA性能[4] 传统MCP流程痛点 - 传统MCP需人工配置完整工作流（数据准备、工具注册、prompt编写）[8] - 需设置回退逻辑且功能增多时配置量呈指数级上升[9][10] - 用户需完全掌握任务拆分、工具调用及逻辑设计能力[11][12][13] MCP·RL技术突破 - 实现"做中学"模式：自动发现工具、生成任务、实战训练及策略优化[16][18] - 训练流程四步走：工具发现→任务生成→实战训练→测试泛化[18][25] - 无需人工标注数据，适配任意Server且开箱即用[23] 应用效果与案例 - ART框架对Qwen 2.5-14B强化训练后，在电子邮件检索任务中超越o3达到SOTA[26] - 网友评价其实现从"AI调用MCP工具"到"AI利用MCP"的范式转变[20][21] 技术背景与扩展 - 基于OpenPipe的ART系统（Agent Reinforcement Trainer），核心为LLM经验学习机制[24] - ART可集成GRPO至Python应用，通过RULER评估策略实现参数优化[24][25]

Artificial Intelligence

ART（Agent Reinforcement Trainer）

Artificial Intelligence

ART（Agent Reinforcement Trainer）