Workflow
代理网络
icon
搜索文档
经济学人:下一代互联网将为机器而非人类而构建
美股IPO· 2025-12-15 08:24
网络演进与AI代理愿景 - 蒂姆·伯纳斯-李爵士在1999年构想了网络的智能版本,其中日常任务将由“智能代理”完成,而非人类[3] - 自诞生以来,网络虽经巨大演变,但用户体验始终是手动的,需要用户打字、点击和浏览[3] - 如今,人工智能(AI)特别是大型语言模型(LLMs)的发展,使得这一愿景变得触手可及[3] AI代理的技术基础与挑战 - 2022年ChatGPT的推出标志着一个转变,用户开始使用聊天机器人而非传统搜索引擎来整合信息[4] - 当前LLMs可以总结文档、回答问题并进行推理,但尚无法采取行动[3] - “代理”是一类赋予LLMs执行任务工具的软件,而不仅仅是生成文本[3] - 一个核心障碍是通信语言,网站或在线服务通过API与外界交流,但这些API是为人类编写的,各有独特的习惯和文档,对以自然语言推理的AI代理构成艰难环境[4][5] 标准化协议与通信架构 - AI实验室Anthropic开发了“模型上下文协议”(MCP),旨在为代理提供一种标准化的通信方式,使其无需研读技术指南即可询问系统功能并代表用户行动[5] - 谷歌提出了“A2A”(代理对代理)协议,使代理能相互宣传自身能力并协商任务分配[7] - 各大公司正争先定义“代理网络”的主导标准,被最广泛采用的协议将使其支持者的工具更快、更早、更好地发挥作用[7] - 2024年12月9日,Anthropic、OpenAI、谷歌、微软等公司宣布成立“代理人工智能基金会”,将开发面向AI代理的开源标准,Anthropic的MCP将成为其中一部分[7] 人机界面桥梁与平台竞争 - 微软构建了“自然语言网络”(NLWeb),允许用户用自然语言“与任何网页聊天”,从而更容易让语言模型访问为人眼设计的网站内容[8] - NLWeb能通过一句自然语言完整捕捉用户意图并作出回应,架起了现代视觉互联网与代理可用互联网之间的桥梁[8] - 一场以代理为核心的新平台之争正在形成,类似于1990年代的“浏览器大战”[9] - OpenAI和生成式AI初创公司Perplexity已推出由代理驱动的浏览器,可追踪航班、获取文档并管理电子邮件[9] - OpenAI在ChatGPT内实现了对部分网站的直接购买功能,并集成了Spotify和Figma等服务[9] 行业影响与商业模式演变 - 现有巨头对代理驱动的功能感到不安,例如电商平台亚马逊起诉Perplexity,指控其浏览器未披露是在代替真人购物[9] - 短租应用Airbnb选择不与ChatGPT集成,称该功能“尚未完全就绪”[9] - 当今网络主要依靠吸引人类注意力来盈利,科技巨头Alphabet和Meta预计2024年通过搜索广告和社交媒体信息流赚取近五万亿美元,占其总收入的80%以上[10] - 未来营销人员可能需要打动“代理的注意力”,策略如优化排名、精准定位偏好、付费置顶的受众可能变为算法[10] - 由代理主导的浏览可能极大扩展在线活动,AI代理可在数秒内扫描数千页内容,并行处理多项任务,其使用网络的频率可能达到人类的“数百甚至数千倍”[10] 代理能力与潜在风险 - AI代理的行为可能超出用户的完全理解,可能犯错并编造解释[11] - “提示注入”等外部操控风险可能诱使代理泄露数据、绕过安全检查或执行未经授权的操作[11] - 安全措施包括将代理限制在可信服务范围内、赋予其有限权限(如“只读”模式),或要求人工确认后才能行动[11] 未来网络形态展望 - 尽管存在风险,软件开发者依然乐观,设想互联网将从“拉取”模式(人们主动发起操作)转向“推送”模式(代理主动行事)[11] - 这可能成为全新且截然不同的网络版本的基础[11]
微软CTO:AI已经“能力过剩”,行业需要努力缩小模型能力与实际产品交付之间的差距
华尔街见闻· 2025-05-22 16:38
AI代理发展现状与挑战 - 模型的推理能力已超前于实际应用方式,行业需弥合模型能力与产品交付之间的差距 [1][2][7] - 代理需解决记忆系统局限性和生态系统构建问题,以实现复杂任务处理 [2][8][9] - 当前代理记忆系统多为一次性事务性,缺乏连续性,限制复杂任务委托 [9] 代理网络与生态系统构建 - 代理需具备行动能力、工具使用及信息访问权限,类似互联网的开放生态系统是关键 [10][11] - MCP协议和NL Web标准在代理网络中扮演类似HTTP和HTML的角色,推动能力落地 [11][18] - 微软推动内部系统采用统一协议,避免组织结构影响代理设计,提升开发效率 [15][17] 微软的战略定位与开放模式 - 微软作为平台公司,致力于解决代理网络底层问题,推动开放生态系统建设 [20][26] - 开放模式能激发创新活力,无需许可的开放式创新是战略选择重要原因 [29][31] - 安全模型可通过AI能力实现,代理可动态评估风险并请求授权,平衡开放与安全 [24][25][33] 软件工程与代理编程的未来 - 代理编程是软件开发多次变革之一,工具变化时应保持开放心态 [39][43] - 开发者将拥有多样化代理工具选择,创新源于对用户问题的深入理解而非基础设施 [47][48][49] - 初创公司通过微调现有基础设施解决特定问题,推动代理多样性发展 [48][50] 行业趋势与未来展望 - 代理将处理更复杂任务,代理网络连接更充分,推动同步交互向异步交互演进 [3][57][58] - 技术成本下降与能力提升将加速代理普及,质疑声音将失去市场 [55][56] - 2025年焦点将转向代理网络成熟度与推理能力增强,而非技术准备度争论 [54][57]