Workflow
Context
icon
搜索文档
李彦宏说的「MCP」,还有人不知道吗?
36氪· 2025-04-28 09:26
MCP协议概述 - MCP全称为"Model Context Protocol",是一种允许大模型标准化调用外部工具的开放协议 [6] - 该协议由Anthropic于2024年11月首次推出,2025年2月开始全球范围快速普及 [6][12] - 类比为给大模型安装"万能插座",统一不同工具间的交互标准 [6] 行业应用现状 - 高德地图、微信读书等应用已推出官方MCP服务器供开发者调用 [2] - OpenAI、谷歌、Meta及国内BAT等科技巨头均宣布支持MCP协议 [2] - 全球已有超过4000个MCP服务器上线,数量持续快速增长 [12] 技术价值 - 解决大模型与外部工具交互缺乏统一标准的问题,提升代码复用性 [11] - 开发者无需维护工具性能,只需专注应用开发,工作量减少50%以上 [12][13] - 支持云端/本地多种部署形式,不限制底层模型类型 [19] 生态发展 - Cursor、VSCode等主流开发工具2025年2月起支持MCP协议 [16] - OpenAI于2025年3月27日宣布支持,成为生态转折点 [16] - 对比封闭的GPTs商店,MCP开放特性更受开发者青睐 [18][19] 现存挑战 - 部分MCP服务器工具不足20个,存在功能不完善问题 [15] - 非官方维护的服务器存在安全性和稳定性风险 [12][15] - 大厂商可能保留核心数据接口,未完全开放能力 [15] 行业影响 - 被类比为AI领域的"秦始皇统一标准",可能引发2025年AI应用爆发 [4][5] - 促使大模型厂商从封闭生态转向开放合作战略 [17][21] - 开发门槛降低使AI应用创新从"星星点点"转向规模化发展 [3][5]
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 22:10
Agent定义与核心特征 - Agent是基于环境反馈使用工具的程序 采用Anthropic的定义[2] - 核心三要素包括状态(Context)、行动(Tool Use)、激励信号(RL反馈机制)[32][33] - 与RL强关联 需理解强化学习才能设计优质Agent产品[31] Agent技术演进 - 2023年4月AutoGPT为代表的早期Agent更像玩具 实际应用价值有限[4] - 当前Agent已能在工作生活场景中真正解决问题 实现价值跃迁[5] - 进步源于:1)底层模型能力提升(如RL结合、长思维) 2)工程产品突破(Context构建)[6][7] Context工程创新 - Context是大模型执行任务所需信息总和 不同产品Context构成不同[8] - 相比传统RAG Agent能自动化提炼Context 减少人工干预[10][11] - 优质Context需包含用户历史行为路径 如APP打开瞬间即提供海量意图线索[48][49] Tool Use技术方案 - Function Call/MCP/A2A属于代码驱动派 Computer Use/Browser Use属于视觉模拟派[13] - MCP核心价值在于统一Tool Use标准 降低工具调用门槛[12] - Browser Use存在纯视觉方案(如已倒闭的Adept)和API包装方案 后者更成熟稳定[15] 产品设计方法论 - Chat是最佳交互入口 保障用户自由度优于追求准确度[41] - 需解决双重信任问题:开发者信任模型能力 用户信任执行过程[52][54] - 垂直领域Agent将长期主导 通用Agent面临收敛困难[25][46] 行业竞争格局 - 当前Agent可分为:1)Coding Agent(交付代码) 2)调研Agent(交付报告) 3)表格Agent(定量分析)[61][64] - Sheet0实现100%准确率 核心在于模块化工具复用与AI Coding验证[57][67] - AI Coding与Agent存在协同效应 但直接编码执行任务成本过高[29][30] 发展关键变量 - 模型能力突破与Context工程进步是两大核心驱动因素[69][70] - 需构建完整评估体系(激励信号) 确保系统可收敛[35][71] - 产品需平衡通用性与准确性 不同场景选择不同技术路径[59][60]
扣子空间—字节的agent
小熊跑的快· 2025-04-21 07:52
4月18日晚间,字节跳动扣子空间开启内测,定位通用Agent。与其他类似产品如manus一样,扣子空间 采用了邀请码制。平台上,用户可以选择精通各项技能的通用实习生,也可以选择行业的领域专家,通 过与 AI 的互动完成工作任务。 据官方介绍,扣子空间主要有以下特点: 1) 从回答问题,到解决问题 全线打通:自动分析需求,拆解为多个子任务;自主调用工具(浏览器、 代码编辑器等),执行任务;输出完整的结果报告,例如网页、PPT 、飞书文档等。 2) 拥有 专家Agent生态 :华泰A股观察助手可以为用户进行每日早报生成、针对股票分析问题、答疑 解惑;用户研究专家可以协助进行用研资料深度分析,获取更多用户洞察。 3) 探索/规划双模式 ,人机协同完成高难度任务:用户如果想一步到位输出,可以选择探索模式、如 果想亲自把控每个步骤,可以选择规划模式。 4) MCP扩展集成 ,拓展Agent能力边界:首批官方支持飞书多维表格、高德地图、图像工具、语音合 成等MCP;即将支持扣子开发平台发布MCP至扣子空间。 通过支持添加MCP扩展,AI Agent能力边界被进一步扩展,接下来会有更多插件接入。 MCP(Model Con ...
MCP:Agentic AI 中间层最优解,AI 应用的标准化革命
海外独角兽· 2025-03-24 19:49
文章核心观点 - MCP是对其他所有LLM中间层的集大成者,已显著垄断Agentic AI中间层且生态已出现,可能带来“Agentic AI领域的Stripe”,能让Context Layer效果最大化,是Agentic AI的安卓,其生态下创业公司有三个主要机会 [2][4][7][23][25][32][33] 各部分总结 Insight 01 - MCP是开放协议,允许系统向AI模型提供上下文信息,可在不同集成场景通用化,定义了AI模型调用外部工具、获取数据及与服务交互的方式 [4] - 发布一个季度内,MCP使用增长速度是所有开源框架中最快的,2025开年以来显著垄断AI Apps & Agents和Tools & Data Sources间的中间层 [5] - MCP在AI开发者核心圈口碑和讨论度高 [6] Insight 02 - MCP在开发者群体渗透率增长极快,围绕其已出现“生态”,包括MCP Clients、MCP Servers、专门的Marketplace、Infra等产品 [7] - MCP核心概念有客户端MCP Client和服务器MCP Server,前者可让产品无缝连到MCP Server获Context,后者可让LLM理解Context Layer,是轻量级Context连接软件 [8] - MCP Client指LLM - native产品或Agent,可通过MCP协议访问数据,一个Client可和多个MCP Server连接,目前多数高质量Client以编程为中心,非技术用户可用Claude Desktop作为切入点 [10][11][12] - MCP Server可看作开放版的GPTs,头部数据库、Coding公司和创业公司基本都有自己的Server,其使用场景多元,开发模式由社区推动,企业也开始开发官方版本 [13][15] - MCP在GitHub的154个MCP Servers列表里,使用场景最多的是搜索和数据检索,还包括数据库、设计、支付等多个领域 [16] - 去年12月Anthropic举办MCP Hackathon,结果显示MCP使用场景多元,开发者希望通过其实现tool use或执行多步骤任务,获奖成果有Santa Claude、Clauduct Manager等 [18][20] Insight 03 - MCP是转接口,能打通不同数据类型和AI应用,Anthropic将其类比为USB - C端口,隐含打造标准化接口的目标,该接口定义在MCP Server和LLM之间 [21] - MCP将数据转接工作量在各方重新分配,虽不能和Stripe直接类比,但“Agentic AI的Stripe”可能是创业公司机会,是Agent领域关键infra [22][23] Insight 04 - 让AI Agent发挥作用需正确丰富的Context、完整工具使用环境和持续迭代的记忆,MCP以Agent为中心的执行模式超越LSP,能帮助Context Layer实现最好效果 [24][25] - Tool use核心是RL环境,memory目前无标准化趋势 [28] Insight 05 - MCP出现前已有很多中间层产品,MCP集各家之长,更轻量、开放,对这些产品冲击不小 [29] - OpenAI Function Call给MCP启发,但MCP更具生态价值;OpenAI GPTs思路被MCP沿用,但太封闭;OpenAI Agent SDK和MCP不同;LangChain和LlamaIndex受冲击大;Composio在MCP环境下生态位不错 [29][30] Insight 06 - 开发者让不能控制或开发的Agent获取数据源和工具时,MCP是最佳选择,其开源灵活,但使用效果精细和效率可能不如Agent SDK,类似安卓,目前不确定OpenAI Agent SDK等是否类似苹果 [32] Insight 07 - MCP生态下创业公司有三个主要机会,分别是Agent OS、MCP Infra、MCP Marketplace [33][35] - Agent OS可将大量MCP Server层统一抽象,使Context和tool use更自然分发和交互 [35] - MCP Infra核心目标是让MCP更可靠、可扩展,需将其设计成无状态协议,还有支持托管与多租户等多种做法 [36][37] - MCP Marketplace可帮助Agent选到更好产品,如Cline发布的MCP Marketplace,用户可浏览、搜索、一键安装MCP Server [39][40][41]
晚点对话 MiniMax 闫俊杰:千万别套用移动互联网的逻辑来做 AI
晚点LatePost· 2025-01-17 15:46
核心观点 - 公司认为AI行业的核心驱动力是技术迭代而非用户增长,智能水平的提升不依赖大量用户反馈[8][17][19] - 公司明确自身定位为技术驱动型企业,在技术路线与产品需求冲突时优先选择技术突破[22][23] - 行业存在方法论误区,多数企业仍用移动互联网推荐系统思维开发AI产品[12][20][97] - 开源是加速技术进化的有效路径,公司首个开源模型MiniMax-01采用创新线性注意力机制架构[9][14][15] 技术路线 - MiniMax-01系列模型突破性采用线性注意力机制新架构,可高效处理400万token长上下文[9][45] - 模型参数规模超4000亿,是全球首个在此量级实现线性注意力机制的大模型[76] - 技术目标聚焦Agent能力提升,重点突破长上下文记忆、多Agent协同等方向[40][44] - 明确不跟风o系列模型开发,认为蒸馏技术虽可行但非核心创新路径[53][54][58] 产品策略 - 旗下海螺视频生成模型月访问量已达全球第一梯队水平[77] - AI社区产品"星野"用户留存率优于字节等大厂竞品[7][92] - 放弃移动互联网式增长目标,2025年核心KPI转为技术研发指标[106][129] - 测试中的信息获取产品尝试重构推荐逻辑,实现精准学术内容推送[62][63] 行业认知 - 中美AI差距在于中国缺乏原创性技术benchmark,过度依赖对齐国外模型输出[72] - 大模型与推荐系统存在本质差异:前者依赖预设能力分级,后者依赖AB测试[21][66] - 行业已从"Scaling Law信仰"转向寻求算法、组织等层面的持续创新[33][34] - 竞争格局不应区分创业公司与大公司,关键在于技术进化速度[98][114] 组织管理 - 团队结构保持三级扁平化管理,强调客观技术评估文化[79][81] - 人才策略承认字节跳动的人才密度优势,但认为创业公司更利技术人才成长[82][130] - 决策机制建立在共同技术认知基座上,弱化明确分工边界[125][126] - 主动优化团队结构,淘汰非技术驱动型人员[115][116] 创始人反思 - 复盘早期失误包括过度关注用户指标、未及时开源、产品定位摇摆[13][15][24] - 认知升级关键点在于明确技术迭代优先于商业化目标[132][133] - 创业方法论强调简单专注,拒绝"天选之子"叙事[30][140] - 自我定位非技术天才型创始人,重视团队协作价值[96][136]