Workflow
Agent Infra
icon
搜索文档
AI Agent 很火,但 Agent Infra 准备好了吗?
Founder Park· 2025-12-25 17:04
文章核心观点 - 基础设施软件的主要使用者正从人类开发者转变为AI Agent,这要求基础设施的架构范式发生根本性变革,以支持AI Agent的自主、高并发、低延迟和不确定性任务处理 [1] - 当前的基础设施仍主要为人类开发者设计,无法满足AI Agent的需求,因此面向“原生智能体”的基础设施建设将成为未来的关键门槛和巨大市场机会 [1][3] - AI Agent的开发和落地范式与传统App完全不同,其核心区别在于系统从确定性转向概率性,这要求工程思维、基础设施和商业模式进行彻底重塑 [3][4][6] Agent Infra 与传统软件工程的根本区别 - **核心区别在于不确定性**:传统软件依赖确定的if/else逻辑,而AI Agent依赖概率性目标规划和提示词调教,其行为更像教育孩子而非修复水管 [4] - **系统性质发生改变**:AI Agent是由模型、提示词、上下文等多因素共同决定效果的“不确定性的复杂系统”,而传统的微服务是调用关系清晰的“确定性简单系统” [6] - **交付物与工作方式转变**:传统工程交付确定的功能,判断标准非对即错;AI Agent工程交付的是一种概率性能力,工程师需要从追求确定性转向驾驭不确定性 [6][7] Agent Infra 的定义、现状与挑战 - **定义尚未明确**:Agent Infra的边界尚未完全定型,其核心作用是帮助解决AI Agent落地过程中的“偶然复杂度”,但不同应用场景的偶然复杂度差异巨大 [11] - **解决公共的偶然复杂度**:行业领先者正聚焦于所有场景下偶然复杂度的“最大公共子集”,包括安全问题、执行环境、工具体系、记忆管理和可观测性 [11] - **安全沙箱是突出需求**:由于AI Agent自主运行带来的风险,全方位的安全沙箱服务成为关键,需从虚拟化、网络和凭证层面限制其操作边界 [12] - **完备范式尚未出现**:当前云厂商提供的Agent Infra产品多是从上一代技术演进而来,并非基于全新范式思考,行业仍在探索完备的Agent Infra形态 [15][16] 当前Agent Infra的主要服务场景 - **主要应用方向**:根据LangChain报告,客户服务、研究与数据分析是当前Agent最火热的两大应用方向 [17] - **具体服务场景**:主要包括Vibe Coding、深度研究与数据处理、GUI Agent以及强化学习场景,这些场景普遍依赖云端沙箱环境来实现安全隔离与资源弹性 [18][19] - **开发者核心需求**:开发者对Agent Infra的需求聚焦于极致的使用体验和完善的生态兼容性,以降低开发成本,统一的API标准至关重要 [20] 行业参与者的实践与优势 - **腾讯云的实践**:腾讯云推出了Agent Runtime解决方案,其沙箱服务实现了全球领先的80毫秒启动速度,这依赖于从底层计算到调度层的全栈深度优化 [21][22] - **显著的效益提升**:腾讯内部一些Agent产品从传统方案切换到Agent Runtime沙箱后,成本节省了90%以上 [23] - **性能标杆**:在典型应用生成场景中,Agent Runtime能做到端到端200毫秒的全流程响应,而全球多数同类产品需要秒级等待 [24] Agent Infra 的未来重点与创业机会 - **下一阶段技术重点**:可调试性、语义化的情景记忆管理以及支撑实时交互的低延迟性能是未来的发展重点 [27][29] - **核心演进方向**:Agent Infra需要完成从“服务Agent的构建与运行”到“服务Agent的智能进化”的跨越,即利用Agent产生的真实业务数据反哺模型与Agent的迭代优化,形成智能进化闭环 [30][31][32] - **创业机会存在**:在范式标准未明确时,并非只是大厂的赛道,谁能更快更好地支持Agent的特性需求,谁就有可能更快占领市场 [26] - **商业模式变革**:AI Agent极大地民主化了“计算”,降低了原型验证和开发的边际成本,使得许多过去不经济的商业模式变得可行 [26]
智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify
量子位· 2025-12-23 12:16
文章核心观点 - 2025年被定义为“Agent元年”,行业焦点从年初的宏大叙事转向年末的工程化落地,Agent正从技术萌芽走向务实应用 [1][2][3] - Agent的快速共识源于其能真正解决问题,并伴随一系列工程方法(如Agent Infra、Runtime、架构范式)的快速成型,实现了落地 [12] - Agent落地面临的核心挑战是其作为一个“不确定性的复杂系统”,需要确定性的工程方法(如科学实验思维、Day Two思维)来驾驭 [6][19][20] - Agent Infra是智能体落地的关键一环,它通过解决安全、执行环境、工具、记忆和观测等“偶然复杂度”问题,为Agent的可靠运行和智能进化提供支撑 [5][23][38] Agent发展阶段的总结 - Agent发展已从年初硅谷的“宏大叙事”和“立法阶段”(靠Demo吸引资本),进入年末充满“烟火气”的“司法阶段”,处理具体、琐碎的执行问题,走向务实 [6][9][10][11] - 行业发展并非线性进步,而是“根茎状的蔓延”,秩序的建立更多依赖于产品工程、提示词工程、RAG、Pipeline等“胶水”技术 [12] - 共识的形成部分源于资本在互联网红利见顶后,寻求新的组织方式,Agent承诺了“交互成本的坍塌” [12][13] Agent落地与AI落地的区别 - 范式发生明显转移:从传统的if/else逻辑判断和确定性功能交付,转向Agent的“概率性目标规划”和“概率性能力”交付 [14][18] - 关键区别在于“新增了很多不确定性”:Agent的失败是对意图的误解或概率漂移,修复方式从“修Bug”变为像“教育孩子”一样进行约束 [18] - Agent是一个由模型、架构、Prompt、工具等七八个因素相互影响构成的“不确定性的复杂系统”,其输出具有不确定性,与传统微服务系统相反 [19] Agent Infra的角色与关键要素 - Agent Infra的核心作用是解决企业在Agent落地中遇到的“偶然复杂度”问题,而非业务本身的本质复杂度 [6][23] - 当前Infra层致力于构建解决偶然复杂度问题的“最大公共子集”,包括:安全、执行环境、工具、记忆和观测 [23] - 在Agent Infra中,“安全”尤其是“Agent的自主运行”带来的破坏性风险是最突出的问题,需要多层次、全链路的安全体系(如安全沙箱)来解决 [21][25][26] - 对于Infra的开闭源选择呈现分层互补:初创公司和创新者倾向于开源以获得低成本、灵活性和透明度(白箱);大企业则倾向于商业版或闭源以获得责任转移与兜底服务 [27][28][29] 技术进展与未来趋势 - **AI代码工具**成为标志性实践和重要趋势:它不仅是解决代码问题的工具,更成为Agent连接现实世界的通用接口,并颠覆了原有的软件工程范式,推动从AI Coding到AISE(AI软件工程师)的转变 [7][33][34] - 技术正在从开发者向非开发者移动,简化程度逼近“AI开发的Excel时刻”,将基础设施认知负荷降至最低,使开发者能聚焦于Prompt和数据治理 [31][35] - Agent Infra的下一步重点是从“服务好Agent的运行构建”转向“服务好Agent的智能进化”,关注其安全可靠运行,并利用运行数据持续优化Agent本身和模型 [38] - 未来重点方向可概括为:**秩序**(让混乱模型可控)、**连接**(打通Agent孤岛融入业务)、**自动**(任务自动化)、**安全高效**、**智能进化**、**人机协同** [39] - 记忆管理需要超越简单的向量搜索,关注语义化的情景记忆和可计算的时间观,将记忆和目标视为可重写、降级的变量并进行置信度处理 [40] 对开发者和企业的影响与门槛 - 对于中小公司和个人开发者,最大的门槛并非技术或成本,而是**缺乏开始的勇气**以及企业**数据的壁垒**;同时,**商业模式**的探索和转变是关键,因Agent尚未到全面改变社会商业模式的阶段 [6][40] - 对于专业开发者和AI原生企业,Infra产品主要帮助治理其面临的复杂问题,加速Agent落地 [31] - 若Agent成为主流,将对移动开发生态产生影响:公司会要求在APP中集成Agent能力,促使开发者思维从工程转向科学实验;利用AI Coding工具开发APP则要求改变协同模式和工具体系 [41][44] - 未来的应用交互形态(如iOS/Android)尚无定论,但只有那些与AI工具为伍、改造研发流程并用科学实验思维驾驭不确定性的人,才能抓住形态转移的机遇 [42][43]
Agent应用爆发,谁成为向上托举的力量?
36氪· 2025-08-06 18:31
AI Agent发展现状 - AI Agent正从被动响应迈向主动决策 成为连接数字世界与物理世界的核心枢纽 [1] - 具备推理、规划、记忆与工具使用能力的智能体正在重塑产业形态 涵盖企业Agent、学术Agent和个人Agent [1] - 2025年AI Agentic基础设施迎来爆发拐点 开源大模型突破提供认知"大脑" 模型上下文协议生态繁荣赋予灵活"四肢" [1] - 全球80%企业将在年内部署Agent 大脑与四肢的协同进化倒逼基础设施全面升级 [1] 企业应用痛点 - 早期RPA产品只能自动化简单单一工作流程 不具备真正智能且不能解决复合化复杂问题 [3][4] - 生成式AI出现后真正具备智能的Agent应用带来效率提升 但网页或App形式不适合专业开发者与企业用户 [5] - 本地部署面临五大核心痛点:AI推理算力限制、任务执行算力弹性不足、工具配置复杂、权限冲突问题、安全性差 [5][6][7][8][9] - 消费级设备无法部署高精度大模型 云端算力成为主流方案但存在弹性扩展难题 [6] - 超过43%的MCP服务节点存在未经验证Shell调用路径 83%部署存在配置漏洞 88%AI组件未启用防护机制 [9] - Agent缺乏长期记忆影响业务使用范围 语义记忆和场景记忆缺失限制任务完成能力 [10] 基础设施解决方案 - 云厂商竞相推出新一代Agent Infra架构:AWS AgentCore解决长时执行与状态记录 Azure AI Foundry集成Serverless计算 Google Vertex AI优化长时运行需求 [12] - 阿里云函数计算Function AI提供自主选择模型与工具的组装式设计 PPIO推出国内首个Agentic AI基础设施服务平台 [13] - 新一代基础设施聚焦长时运行、会话亲和、会话隔离、企业级IAM和VPC及模型框架开放等技术突破 [18] - 突破传统Serverless执行时长限制(如AWS Lambda15分钟上限)支持数分钟至数小时连续工具调用 [18][19] - 通过状态持久化、冷启动优化和开放集成解决LLM Agent持续推理、Workflow Agent状态流转和Custom Agent灵活定制需求 [22] - 开发范式从手动拼凑传统组件转向利用原生Infra实现高效安全可扩展的开发部署 [23] 市场机遇与发展趋势 - Agent Infra成为模型公司、云厂商和初创公司积极拓展领域 创业公司存在显著机会 [24] - 机会存在于现有Infra的AI-native需求环节 包括更快冷启动速度、更强隔离性及更好的AI workflow结合 [24] - 易用性高且价格合理的Infra产品有望被广泛采用 因Agent开发追求研发投入ROI [24] - 基础设施持续创新推动Agent生态共建 使开发变得像组装乐高积木一样便捷 [24]
Agent Infra 图谱:哪些组件值得为 Agent 重做一遍?
海外独角兽· 2025-05-21 20:05
核心观点 - Agent Infra需求爆发,开发范式正在重构和收敛,四大赛道值得关注:Environment、Context、Tools、Agent Security [3][13] - 创业公司机会在于:1) 在已有Infra中寻找真正Agent-native需求 2) 抓住Agent开发中新痛点 [4][5][16][17] - 云厂商积极布局但尚未出现Agent-native产品,初创公司在细分领域有差异化机会 [63][70] 投资主题1:Environment - Sandbox需满足更高性能要求:隔离性、启动速度、稳定性及AI性能如代码解释器功能 [20] - E2B提供AI-native microVM获Perplexity等头部客户认可 [20][21] - Modal提供Cloud-native虚拟机适合规模化需求 [20][21] - Browser Infra分两类:1) 大规模浏览网页 2) 深度操纵网页 [22] - Browserbase平衡带宽价格速度获开发者青睐 [23][25] - Browser Use新兴公司让Agent像人一样深度操作网页 [24][25] 投资主题2:Context - RAG已成共识技术,Glean估值近70亿美元专注企业内数据搜索 [29][30] - MCP协议标准化工具调用,早期机会在: - 自动生成MCP Server如Mintlify [31][33] - MCP connector如Composio托管100+ Server [31][33] - Marketplace价值较薄可能集成至开发端 [32] - Memory分短期/长期/程序记忆,Letta通过Sleep-time预处理提升推理质量 [34][36][38][40] 投资主题3:Tools - Search & Scraping: - Agent搜索量将远超人类,需AI-native方案 [45] - 机会在廉价API(博查)、智能搜索(Exa)、爬虫架构(Firecrawl) [45][46][47] - Finance & Payment: - Skyfire让Agent具备支付能力类比"AI经济Visa" [49][51][53] - Paid按产出定价重构货币化机制 [52][53] - Backend Workflow: - Supabase一站式后端服务吸引200万开发者 [54][56] - Inngest简化工作流编排获a16z投资 [56] 投资主题4:Agent Security - 需动态意图分析及数据校验,当前以老牌玩家为主 [57][59] - Chainguard提供安全容器镜像 [59][61] - Haize Labs压力测试增强稳健性 [59][61] - 生态完善后AI-native机会更清晰,当前偏早 [60] 云厂商布局 - Environment: - AWS Nitro Enclaves/Azure Container Apps/GCP Cloud Functions均非Agent-native [63][64][65] - Context: - AWS Bedrock/Azure Cognitive Search/GCP Vertex AI推动企业上云 [66][67] - 三大云厂商均推出MCP相关产品与A2A协议互补 [68][69] - Tools: - AWS Step Functions/Azure Logic Apps/GCP Workflows未体现Agent特性 [70][71]