Workflow
MCP(模型上下文协议)
icon
搜索文档
MCP已死,CLI当立!Perplexity首先放弃使用MCP,全网赞成
机器之心· 2026-03-13 17:21
文章核心观点 - MCP协议在推出一年多后正走向消亡,行业领先公司如Perplexity和Duetchat已放弃或删除对其的集成,其根本原因在于协议设计存在天生缺陷,尤其是在线性上下文成本、使用效率及可调试性方面表现不佳,而传统的CLI和API方案被证明是更优选择[3][4][8][9][11][14][17] MCP协议的现状与行业态度 - MCP协议由Anthropic于2024年11月推出,旨在成为大模型通信和交互的标准协议,但推出一年多后已声量微弱,甚至其“一周年纪念日”也在一片寂静中度过[3] - 行业对MCP的质疑始终存在,包括“builder多于user”和“旧瓶装新酒”的批评[3] - Perplexity的联合创始人兼CTO Denis Yarats在公司内部表示,正在放弃MCP,转而使用API和CLI[4] - 曾全面支持MCP集成并实现了OAuth和动态客户端注册的AI聊天工具Duetchat,在其v2版本中彻底删除了MCP功能[8] - Y Combinator总裁兼CEO Garry Tan公开批评“MCP sucks”,随着Skills逐渐占据智能体应用主场,MCP似乎早该消失[9] MCP协议的技术缺陷与问题 - **线性上下文成本高昂**:MCP协议要求将每个工具的名称、描述、参数Schema和示例都注入Agent的上下文窗口,若连接10个服务且每个服务有5个工具,在任务开始前就可能消耗掉数千个Token,极大地挤占了宝贵的上下文窗口资源[11] - **使用模式难以为继**:为应对高成本,用户只能在不理想的方案中做选择,包括:1) 预先加载所有内容,导致实际任务性能下降;2) 限制集成数量;3) 构建动态工具加载,但会带来延迟和复杂性[11][12] - **日常使用体验差**:存在初始化极不稳定、无休止的重新认证以及权限管理非黑即白(仅能通过名称白名单,无法限制为只读或限制参数)等问题[18] CLI与API方案的优势 - **大语言模型天然擅长使用CLI**:大语言模型在数以百万计的man手册、Stack Overflow回答及Shell脚本仓库中受过训练,给予它们CLI和文档,它们就能有效工作[14] - **CLI具备一致性与可调试性**:当AI操作出错时,人类可以运行相同的CLI命令来复现和调试,输入输出一致,没有谜团,而MCP下的工具操作仅存在于对话内部,出错后需翻查复杂的JSON传输日志[14] - **CLI具有强大的可组合性**:可以通过`jq`、`grep`等工具进行数据过滤、逻辑串联或重定向,这通常是唯一可行的方法,而使用MCP要么需将整个计划塞入昂贵且有限的上下文窗口,要么需在服务端构建自定义过滤功能,结果更差且耗费更多精力[15] - **CLI是经过时间检验的成熟工具**:CLI经历了数十年的设计迭代,可组合、可调试,并且能利用现有的认证体系,对人类和机器都友好,是一个已经足够好的抽象层[16][17]
Agent Infra 吃掉 Manus
36氪· 2026-01-04 13:42
文章核心观点 - 大厂通过构建Agent Infra(智能体底座)正在对AI Agent领域进行“合法入室”和“清场”,将基础设施标准化、成本极致化,并掌控核心权限与安全标准,这导致独立的Agent应用价值被侵蚀,未来将“功能化”并融入各类垂直业务场景[2][7][22][23] - 对于创业者而言,未来的机会不在于与大厂竞争基础设施,而在于深挖无法被标准化的垂直行业业务潜规则(Know-how),并将Agent能力像“盐溶于水”一样嵌入到企业的具体业务流程中[8][11][25][26] Agent Infra的定义与战略意图 - Agent Infra被比喻为AI时代的操作系统,向下管理算力调度,向上为各种任务提供引擎,是支撑Agent运行的“路、红绿灯、加油站”[1] - 大厂布局Infra的核心战略是重新定义领域的“房东”,通过收购Manus等激进操作直接切入最底层的地基环节,改变游戏规则[2] - 大厂推行MCP(模型上下文协议)等标准,旨在底层修建“高速公路收费站”,收编接口,使创业者过去依赖的非标接口和脚本构建的壁垒价值大幅降低[3][4] 大厂构建的壁垒与不对等优势 - **接口标准化收编**:大厂通过Infra制定规矩,要求第三方服务向其地基靠拢,使创业者辛苦对接的私有接口价值缩水[3] - **权限控制**:大厂掌握基于微型虚拟机的原生沙箱隔离技术,使其Agent拥有“系统级权限”,能直接调用底层资源,而创业者的Agent则像权限受限的“外来户”[5] - **成本优势**:大厂通过Serverless GPU等“算力自来水”技术,将GPU资源碎片化并按需调度,可将单次任务成本降至原来的十分之一甚至百分之一[20][21] - **建立信任与安全**:大厂在Infra层构建全流程的“审计链”,记录Agent的每一步操作,并配备熔断机制,以解决企业对于Agent安全可控的信任问题[15][16] 对创业者和行业的影响 - **独立Agent应用价值衰减**:当执行引擎、工具协议、安全沙箱和廉价算力都被封装进大厂地基后,Agent可能不再是一个独立应用,而会退化为操作系统中的一个右键菜单或业务系统中的一个无感按钮[6][22][23] - **通用Agent能力贬值**:依靠大厂Infra,调用通用接口(如订机票)的能力将变得廉价且易得[8][9] - **垂直行业Know-how价值凸显**:真正值钱的是理解特定行业“业务潜规则”的能力,例如跨国贸易中的税务优化路径、医疗报销中的地方政策差异、制造业中的供应链替代方案等,这些是大厂通用Infra无法提供的[9][11] - **中间商模式受冲击**:依靠“赚Token差价”或“套壳封装”的商业模式将难以持续,因为算力正变成像自来水一样的廉价基建[22] 给创业者的生存建议 - **放弃基建幻想**:不应再投入Runtime、沙箱、通用协议等基础设施,这些已成为大厂标准化的“水电煤”[25] - **深挖业务潜规则**:寻找Infra无法进入的“深水区”,那些无法被标准化、甚至带点灰色的行业SOP(标准作业程序),才是创业者的核心价值与“租金”来源[25][26] - **拥抱“功能化”**:不再执着于开发独立的Agent应用,而是将能力像盐一样溶解并嵌入企业的知识库、数据库和具体业务流中[25][26] 成本与案例数据 - 一个普通的复杂Agent任务运行成本约为2美元[18] - Manus在尝试制作一个简单的网页版数独游戏时,耗光了1300积分,相当于花费13美元仍未完成任务[18] - 大厂通过Serverless GPU等技术,可将单次任务成本压至原来的十分之一甚至百分之一[21]
豆包被封VS硅谷结盟,谁在葬送中国的万亿AIoT市场?
36氪· 2025-12-16 18:17
豆包手机事件与行业反应 - 字节跳动旗下豆包手机于12月1日上线,其AI智能体试图通过模拟点击操作其他应用[1] - 上线次日,腾讯以“登录环境异常”为由封禁豆包操作微信的账号,阿里系应用(淘宝、闲鱼、大麦)则触发人机验证或强制登出,农业银行、建设银行彻底封死其登录与支付通道[3] - 豆包团队在12月5日发布公告,宣布限制智能体在刷分、刷激励、金融支付及部分游戏场景中的操作权限,从上线到妥协不到五天[3] AI智能体发展路径的矛盾 - 豆包代表的GUI智能体路线是一种“数字寄生”,通过模拟人类点击绕过应用接口,被平台视为对数据主权的侵犯和流量劫持[4][5] - 依赖“视觉识别+模拟点击”的路线本质脆弱,需与App的反爬虫机制持续对抗,且任何前端UI更新都可能导致智能体失效,在AIoT设备上问题更严重[6][7] - 双方立场不可调和,冲突必然,基于“破解”与“模拟”的AIoT生态将不堪一击[6][7] 硅谷的开放协议路径 - 当地时间12月9日,Anthropic宣布将模型上下文协议(MCP)捐赠给Linux基金会旗下的AI智能体基金会,使其成为开放标准[3][8] - 同一天,Linux基金会宣布成立AI智能体基金会,成员包括AWS、谷歌、Meta、OpenAI和Anthropic等竞争对手,旨在通过合作解决互操作性瓶颈[8] - MCP解决了大模型连接外部数据源的标准问题,实现“一个接口,通吃所有数据源”,使模型端与数据端解耦[9] - 该基金会项目还包括OpenAI捐赠的AGENTS.md(为AI提供API调用手册)和Google捐赠的构建智能体和工作流的框架,共同构成从连接、认知到执行的完整工具链[11] - 硅谷正通过制定类似TCP/IP的基础通信协议,将智能体交互从脆弱的“打游击”升级为通过API直达核心数据的“正规军”[12] 中国AIoT产业的挑战与困境 - 根据国家“人工智能+”行动意见,目标在2027年实现新一代智能终端、智能体普及率超过70%,2030年突破90%[13] - 当前生态碎片化是最大障碍,硬件厂商与互联网巨头各自构建封闭体系,导致设备与服务无法互联,形成孤岛[13] - 面临两个陷阱:一是直接照搬美国MCP协议存在数据主权和定义权让渡风险;二是各自为战导致研发成本高、产品迭代慢,拖慢行业落地节奏[15][16][17] - 标准真空期正在关闭,中国需要建立自己的智能体互联协议(如CN-MCP),但由单一巨头牵头难以获得全行业信任[18] - 可行路径是由国家级产业联盟或中立开源基金会牵头,以公信力打破门户壁垒[19] 中国破局的关键与方向 - 中国生态结构不同,服务高度集中在微信、抖音、美团等超级App的黑盒中,外部难以触达[20] - CN-MCP需解决“服务原子化”问题,即推动超级App将内部功能拆解成可被外部调用的标准化接口,而非让AI继续模拟点击[21] - 政府需将智能体互联标准提升至新基建高度,作为数字经济底层管道[22] - 互联网巨头需转变思维,在AI时代封闭意味着边缘化,开放接口让App成为AIoT的基础设施才是延续生命力的选择[22][23] 行业趋势与未来展望 - 豆包手机的遭遇是路径失败,揭示了在没有通用协议下,任何跨越围墙的尝试都会被当作入侵者处理[24] - GUI智能体是旧接口体系瓦解与新协议标准建立空窗期的过渡方案,并非终局[25] - 终局将是通用协议取代私有接口,服务通过标准管道按需流向终端,硬件回归感知与交互[25] - 智能体时代的核心是把万物和服务连起来,谁掌握了连接标准,谁就掌握了下个十年的底层规则[26]
国投智能:Qiko智能体平台已全面兼容MCP(模型上下文协议)
每日经济新闻· 2025-11-26 17:52
公司技术应用与产品进展 - 国投智能已在其Qiko智能体平台中全面兼容并应用MCP(模型上下文协议)[1] - 该平台支持在智能体和工作流中对接MCP,实现大数据操作系统服务等能力与MCP协议的高效转化[1] - 目前MCP协议技术已应用于公司的公共安全大数据、政企数字化等多条产品线[1]
刚刚,ChatGPT支持MCP了,一句Prompt即可全自动化
36氪· 2025-09-11 17:53
产品功能更新 - OpenAI正式宣布ChatGPT支持MCP(模型上下文协议)功能 显著提升自动化程度 用户可通过单一Prompt实现全流程自动化操作[1][3] - 目前MCP功能仅限Plus和Pro订阅用户使用 普通用户暂未开放此权限[2] - MCP协议实现AI模型、工具API与数据源间的标准化交互 通过统一接口降低代码复杂度 支持上下文一致性维护及插件式扩展能力[3] 技术架构特性 - MCP充当不同AI模型间的翻译官角色 使异构模型可采用统一语法通信 实现上下文数据无缝传递 新模型接入可像即时通讯软件加群般简便[4] - 该协议使AI Agent系统(如LangChain)更易集成多模型工具 支持多模型分工协作 未来可实现AI模型与数据源的即插即用式扩展[4] - 用户需在设置中开启开发人员模式 通过"添加源"功能连接自定义MCP服务器 官方提供详细服务器创建指南[5][6][8] 应用场景演示 - 官方Demo展示ChatGPT连接Stripe支付平台后 可直接查询账户余额 执行收费开发票及退款等金融操作 敏感交易需二次确认授权[9][10][13] - 所有复杂操作仅需单次Prompt指令即可完成 包括成功转账、退款处理及客户通知等全流程自动化执行[12][15] - 实际应用显示ChatGPT可获取个人账户数据并参与复杂业务环节 但开启MCP后暂无法同时使用其他高级功能[17] 市场反馈 - 用户社区对MCP功能持积极态度 有反馈认为该功能使ChatGPT实用价值提升10倍[16] - 开发者已发布实际测试视频供参考 同时指出功能存在限制需后续优化[17]
2025上半年AI核心成果及趋势报告
搜狐财经· 2025-08-03 08:04
应用趋势 - 通用类Agent产品深度整合工具使用,主打完成场景多样的深度研究类任务,交付内容更加丰富,成为2025上半年应用亮点 [1][11] - 以视觉操作为核心的Computer Use Agent (CUA)开始推向市场,正与基于文本的深度研究类Agent融合 [1][11][14] - 垂直应用场景开始Agent化,自然语言操控功能成为垂类工作流的一部分 [1][16] - AI编程成为当前最核心的垂类应用领域,头部编程应用收入增长速度创纪录,Cursor ARR突破5亿美金 [1][17] - 模型上下文协议MCP加速大模型应用普及,赋能模型获取大量外部信息、操控现有软件应用 [1][19] 模型趋势 - 模型推理能力在思维链范式下通过堆积更多算力持续提升,数理类、代码类问题提升尤其显著,AIME 25竞赛准确率提升7%,Codeforce代码竞赛排名提升239位 [1][22] - 大模型开始走向Agentic,对工具使用进行端到端训练集成,可完成更复杂困难的任务,Humanity's Last Exam榜单表现提升81% [1][23][24] - 大模型开始端到端融合视觉和文本走向多模态推理,以语言为中枢解锁多模态推理 [1][26] - 大模型图像生成能力全方位增强,语言理解能力升级和审美提升是最大亮点,可生成高拟真度的照片和自拍、吉卜力风格图片 [1][28] - 视频生成模型整合原生配音,可控性和编辑灵活度增加,生成视频的物理规律协调性增强,字节Seeddance 1.0模型在视频生成功能中排名第一 [1][29] 技术趋势 - 训练阶段资源投入向后训练和强化学习倾斜,预训练仍有充足优化空间,强化学习算力消耗未来会超过预训练 [2][9] - 多智能体 (Multi-Agent) 系统可能成为下一个前沿范式 [2][9] - 从交互经验中学习有望成为下一代模型学习方式 [2] - Transformer模型架构快速迭代,混合架构涌现 [2] 行业趋势 - xAI发布Grok 4跻身全球大模型第一梯队,证明大模型无护城河 [2][9] - 算力是AI竞赛关键要素,头部玩家计算集群达数十万卡规模 [2] - OpenAI领先优势缩小,谷歌和xAI迎头赶上 [2][9] - 中美通用大模型技术差距缩小,中国模型在多模态等领域表现出色 [2] - AI编程成为必争之地,海内外头部玩家密集布局 [2][17] - 国内大模型创业公司路线分化 [2]
Agentic AI爆发落地前夜 业界聚焦模型和成本挑战
中国经营报· 2025-07-15 17:51
Agentic AI市场前景 - Agentic AI被Gartner列为2025年十大技术趋势之首,预计2025年市场规模达138.1亿美元,2032年跃升至1408亿美元,复合年增长率39.3% [1] - 全球科技巨头正在投入巨资推动Agentic AI技术演进,行业认为当前处于Agentic AI爆发前夜 [1] - 财富500强企业中75%关键工作负载仍部署在本地,显示AI Agent未来落地空间巨大 [7] 技术驱动因素 - 大模型能力快速提升、MCP和A2A协同协议出现、基础设施成本大幅降低构成Agentic AI三大驱动力 [1] - MCP协议被视为"AI世界的USB-C通用接口",可标准化连接企业内部资源,已在亚马逊等企业实际应用 [3] - 推理成本降低得益于芯片升级(通用/专用GPU、自研芯片)、模型蒸馏(成本降500%)、智能提示路由等技术优化 [6] 企业应用价值 - Agentic AI可提升员工生产效率、优化业务运营、赋能产品服务和商业模式创新 [3] - AI Agent已从孤立算法工具进化为能自主获取服务/数据/上下文的智能实体 [3] - 技术层面需选择AI就绪基础设施、打破数据孤岛、制定明确执行策略 [4] 落地挑战 - 商业化路径不明朗,收益未达成本规模,金融/高风险场景存在监管和可靠性隐患 [5] - 当前多数项目处于早期试点阶段,大规模落地案例有限 [5] - 模型成本高度不一致,专业化复杂模型价格仍高昂,使用成本可能超过基础设施成本 [7] 实施建议 - 管理层面需明确顶层设计,优化机制和人才,做好信息化准备 [4] - 模型选择应注重灵活性,根据工作负载和用例匹配最优方案 [6] - 需客观预期价值创造能力,选择合适的合作伙伴和技术栈 [4]
深度|Anthropic创始人:当机器通过经济图灵测试,就可以称之为变革性AI;MCP是一种民主化力量
Z Potentials· 2025-07-02 12:28
Claude 4的发布与亮点 - Claude 4在编码方面显著提升,能够避免目标偏离效应、过激响应倾向或奖励机制滥用,提高了专业软件工程的可维护性和可靠性 [5] - 新模型解锁了更具智能体性质、更长时间的任务,例如可以无人值守地运行许多小时完成大型代码重构 [7] - 在非编码用例中,Claude 4能够完成复杂的工作流,如将视频转换成PowerPoint,通过多步骤处理实现自动化 [7] - 模型采用成本优化策略,可以根据问题难度决定投入多少计算资源,例如使用Sonnet作为子智能体处理特定任务 [9] AI模型的未来架构演进 - 未来AI架构可能向模块化与专业化方向发展,类似人脑的模块化处理方式,由高层智能体统筹安排专门化的子智能体 [10] - 通过机制可解释性研究,发现模型内部存在专门负责特定功能的权重块,如共情响应、工具使用或图像分析 [10] - 未来可能发展出更复杂的架构,不再是均匀的Transformer主体模型,而是包含专门模块的混合架构 [10] Anthropic的模型开发策略 - 公司保持简单的模型区分策略,根据成本、性能的帕累托前沿来区分模型,未来可能增加更多模型但仍保持同一前沿标准 [12] - 在编程等关键应用领域,公司选择直接与用户建立关系,推出Claude Code产品以加速学习和改进 [13] - 编程能力被视为三重重要领域:受欢迎的客户应用场景、有价值的数据集、以及训练未来模型的重要工具 [14] AI弱监督学习实现自我改进 - 采用Constitutional AI方法,通过自然语言原则让模型自我批评和修改回应,帮助模型更好地嵌入原则 [21] - 在无法直接衡量正确性的领域,使用偏好模型汇总专家反馈,通过强化学习代表人类判断 [22] - 强调经验主义方法,通过与现实世界合作获取验证,如与生物医药公司合作缩短研究报告时间 [23] AI安全的多维挑战 - 安全研究关注从日常问题到严重危害的连续谱系,如从语言使用到生物安全风险 [26] - 采用Responsible Scaling Policy(RSP)确保随着模型智能化提升,部署时做好相应安全防范措施 [28] - 重点关注生物安全领域,因为制造生物危害所需资源相对较少,潜在风险更大 [29] 模型标准化协议与生态共建 - 推出Model Context Protocol(MCP),建立标准化方式获取更多信息和上下文进入模型,促进全生态系统集成 [35] - MCP作为一种民主化力量,允许任何服务提供商与模型进行标准化集成,无论规模大小 [37] - 支持远程MCP使非开发者也能受益,如Google Docs等服务可以通过MCP与Claude AI集成 [38]
对 MCP 的批判性审视
AI前线· 2025-06-08 13:16
MCP协议概述 - MCP是一个开放协议,标准化了应用程序向LLM提供上下文的方式,类似于AI应用的USB-C端口[1] - 该协议旨在让LLM成为代理并与世界互动,通过标准化API实现模型与数据源/工具的连接[2] - 核心设计为JSON-RPC协议,带有预定义方法/端点,专为LLM交互场景优化[6] 行业竞争格局 - IBM推出正交标准ACP(代理通信协议),谷歌发布Agent2Agent(A2A),形成与MCP的竞争[2] - ACP和A2A聚焦于"代理的代理"场景,但大部分功能可通过MCP原样或扩展实现[31] - IBM承认ACP非必需,其本质是推广代理构建工具BeeAI的商业策略[32] 技术实现问题 - 主要传输协议包括stdio和两种HTTP变体(HTTP+SSE/Streamable HTTP),设计存在严重缺陷[8][10] - HTTP传输方案复杂度过高:需管理跨服务器状态、存在4种SSE开启方式和3种响应路径[23] - 文档质量低下,缺乏实现指导,主要厂商投入数十亿美元训练模型却忽视工程实践[3][13] 协议设计缺陷 - HTTP+SSE模式强制全双工通信,需客户端建立SSE会话后通过独立端点提交写入操作[17] - Streamable HTTP引入安全隐患:会话劫持/重放攻击风险,授权机制与传输方式绑定[24][25] - 状态管理漏洞显著,服务器需维护会话状态直至显式终止,扩大DoS攻击面[26] 改进建议 - 应弃用现有HTTP方案,采用WebSocket实现与stdio对等的双向通信[11][28] - 需针对常见用例优化而非特殊场景,减少极端情况处理负担[30] - 行业应建立统一标准,避免IBM/谷歌等厂商通过碎片化协议争夺生态控制权[31][32] 实施现状 - Anthropic主导MCP标准化,认为LLM将承担大部分编码工作,故重视开发者体验[5] - 当前实现集中在Python/JavaScript,缺乏Rust/Go等适合生产环境的语言支持[15] - 实际部署依赖Docker容器,暴露依赖管理混乱问题,典型如Hugging Face的依赖地狱[14]
喝点VC|a16z前沿洞察:AI 浪潮下的九大开发者模式
Z Potentials· 2025-05-26 10:10
AI驱动的软件开发范式转变 - 开发者将AI视为构建软件的新基础而非工具 核心开发概念如版本控制、文档、用户界面等正在被Agent驱动的workflow重构 [1] - AI Agent兼具合作者与消费者双重身份 推动开发工具向MCP协议和AI本土IDE演进 开发循环从编写代码转为设计Agent参与的工具生态 [1][4] - 九种新兴开发者模式正在形成 包括AI生成代码版本控制、LLM驱动的用户界面等 这些模式基于实际痛点并展现未来趋势 [1][2] AI原生版本控制系统 - Git的传统代码跟踪模式面临挑战 开发者更关注AI生成代码的行为结果而非逐行变更 SHA哈希值在AI工作流中语义价值下降 [3] - 新型版本控制单元可能转向prompt+测试组合 代码成为prompt/API合同等输入的副产品 Git将演变为记录变更原因及Agent行为的工件日志 [4] - 版本控制系统需新增元数据层 记录参与Agent身份、受保护代码段及人工监督节点 AI审阅者可能介入版本管理循环 [4][5] 动态AI驱动的交互界面 - 传统数据看板存在用户体验过载问题 LLM可将其转化为自然语言交互界面 实现信息检索、洞察生成与未知发现 [8] - 新一代界面支持双模交互 人类使用自然语言指令(如"显示欧洲异常数据") Agent使用结构化可编程接口 两者共享系统状态但呈现方式不同 [9] - Agent界面超越传统警报系统 能提供错误根因分析、影响评估及修复方案 形成人机协作的决策中心 [10] 文档系统的范式升级 - 开发者从被动阅读转向主动查询 文档演变为结合工具索引的交互式知识库 支持语义搜索与Agent调用 [15] - Mintlify等产品将文档结构化存储 成为跨平台代码Agent的上下文来源 文档界面同时服务于人类与机器消费者 [15][18] - 文档功能扩展为AI Agent的指令集 不仅展示内容还指导系统正确使用方法 [15] 项目启动与框架选择变革 - 传统静态模板(如create-react-app)被文本描述生成取代 开发者通过自然语言指令获取定制化技术栈 [19] - AI降低框架切换成本 Agent可执行大规模重构 使框架决策更具可逆性 促进早期项目实验 [20][21] - 生态系统转向可组合的栈特定生成方式 开发者描述预期结果而非选择框架 AI动态组装技术组件 [7][20] 密钥管理新范式 - 传统env文件模式在Agent环境下失效 可能转向OAuth 2.1框架的短期凭证或能力令牌 [24] - 本地密钥Agent兴起 作为敏感凭证中介 实现即时授权与全流程审计 密钥管理更接近API授权模型 [25] 可访问性API的扩展应用 - macOS可访问性接口被Granola等产品改造 成为AI Agent观察应用程序的通用语义层 [27] - 可访问性树增强后可作为Agent首选接口 通过元数据(意图/角色)实现精准感知与操作 [27][30] 异步开发工作流演进 - Agent在后台执行并行任务 开发模式从结对编程转向任务编排 大幅压缩协调时间 [28] - 交互渠道多元化 支持Slack消息、设计图注释、语音指令等多种触发方式 [29][38] - 分支模型可能演进为动态意图线程 Agent异步执行任务直至合并就绪 [32] MCP协议与基础设施原语 - MCP解决Agent上下文获取与能力暴露问题 客户端/服务器逻辑边界实现双向互操作 [33][34] - 虚拟Agent依赖身份验证、计费等基础设施原语 类似人类开发者使用的Stripe/Clerk服务 [35] - 服务商通过MCP服务器暴露架构元数据 使Agent能安全调用计费/订阅等核心功能 [36]