Workflow
Agent2Agent (A2A)
icon
搜索文档
对 MCP 的批判性审视
AI前线· 2025-06-08 13:16
MCP协议概述 - MCP是一个开放协议,标准化了应用程序向LLM提供上下文的方式,类似于AI应用的USB-C端口[1] - 该协议旨在让LLM成为代理并与世界互动,通过标准化API实现模型与数据源/工具的连接[2] - 核心设计为JSON-RPC协议,带有预定义方法/端点,专为LLM交互场景优化[6] 行业竞争格局 - IBM推出正交标准ACP(代理通信协议),谷歌发布Agent2Agent(A2A),形成与MCP的竞争[2] - ACP和A2A聚焦于"代理的代理"场景,但大部分功能可通过MCP原样或扩展实现[31] - IBM承认ACP非必需,其本质是推广代理构建工具BeeAI的商业策略[32] 技术实现问题 - 主要传输协议包括stdio和两种HTTP变体(HTTP+SSE/Streamable HTTP),设计存在严重缺陷[8][10] - HTTP传输方案复杂度过高:需管理跨服务器状态、存在4种SSE开启方式和3种响应路径[23] - 文档质量低下,缺乏实现指导,主要厂商投入数十亿美元训练模型却忽视工程实践[3][13] 协议设计缺陷 - HTTP+SSE模式强制全双工通信,需客户端建立SSE会话后通过独立端点提交写入操作[17] - Streamable HTTP引入安全隐患:会话劫持/重放攻击风险,授权机制与传输方式绑定[24][25] - 状态管理漏洞显著,服务器需维护会话状态直至显式终止,扩大DoS攻击面[26] 改进建议 - 应弃用现有HTTP方案,采用WebSocket实现与stdio对等的双向通信[11][28] - 需针对常见用例优化而非特殊场景,减少极端情况处理负担[30] - 行业应建立统一标准,避免IBM/谷歌等厂商通过碎片化协议争夺生态控制权[31][32] 实施现状 - Anthropic主导MCP标准化,认为LLM将承担大部分编码工作,故重视开发者体验[5] - 当前实现集中在Python/JavaScript,缺乏Rust/Go等适合生产环境的语言支持[15] - 实际部署依赖Docker容器,暴露依赖管理混乱问题,典型如Hugging Face的依赖地狱[14]
OpenAI、谷歌都“认”了的MCP,究竟给开发者带来啥实惠了
虎嗅APP· 2025-04-13 12:09
AI互操作性标准之争 - Google DeepMind CEO宣布Gemini模型将支持Anthropic主导的MCP协议,称其为"AI Agent时代的开放标准",OpenAI CEO此前几周也已表态支持[3] - Google Cloud同时推出自主主导的Agent2Agent(A2A)协议,联合Salesforce、Box等50多家技术伙伴,形成"既拥抱对手标准又力推自家协议"的竞争格局[5] - 行业对AI模型/Agent连接外部数据、工具及彼此协作的需求迫切,MCP获巨头支持被视为走向主流标准的强力信号[5] MCP协议的核心价值 - 由Anthropic提出并开源,旨在创建开放标准规范,让大语言模型无缝连接外部数据源和工具,类比AI世界的"USB-C"或"通用翻译器"[7] - 定义通用规范使AI模型通过轻量级"MCP服务器"与外部资源交互,解决定制集成碎片化问题,借鉴API/LSP等标准化经验[9] - 国内阿里云百炼等平台已跟进上线MCP功能并构建服务生态,标志AI应用开发向统一高效方向迈进[7] MCP的实际应用场景 - 打通AI与外部数据/工具壁垒:支持自然语言查询数据库、浏览修改代码库、接入Slack/Google Drive等生产力工具[10] - 驱动复杂Agent行为:必优科技案例显示AI可组合调用高德地图MCP与PPT工具MCP,自动生成交通主题演示文稿[10] - Codeium在IDE产品中集成MCP使AI能执行文件系统操作、Git交互等开发任务,超越传统代码补全功能[11] - 开源框架LangChain已整合MCP,支持将MCP工具转换为Python/TypeScript代理可调用的LangChain工具[12] MCP的生态发展现状 - 开发者案例显示:通过MCP集成搜索API可构建个性化旅行助手,实现多步骤行程规划(航班酒店查询+地图路线)[14] - 对比特定模型内置功能,MCP的跨模型兼容性促进工具生态繁荣,被称为"AI领域的ODBC"[14] - 当前局限体现在专业领域深度应用(如3D建模),需依赖MCP服务器能力与AI模型对任务的理解程度[15] - 传统API仍具价值,但MCP标准化优势吸引更多参与者,可能成为AI与现有软件集成的基础技术[16]