Agent Infra

搜索文档
Agent应用爆发,谁成为向上托举的力量?
36氪· 2025-08-06 18:31
AI Agent发展现状 - AI Agent正从被动响应迈向主动决策 成为连接数字世界与物理世界的核心枢纽 [1] - 具备推理、规划、记忆与工具使用能力的智能体正在重塑产业形态 涵盖企业Agent、学术Agent和个人Agent [1] - 2025年AI Agentic基础设施迎来爆发拐点 开源大模型突破提供认知"大脑" 模型上下文协议生态繁荣赋予灵活"四肢" [1] - 全球80%企业将在年内部署Agent 大脑与四肢的协同进化倒逼基础设施全面升级 [1] 企业应用痛点 - 早期RPA产品只能自动化简单单一工作流程 不具备真正智能且不能解决复合化复杂问题 [3][4] - 生成式AI出现后真正具备智能的Agent应用带来效率提升 但网页或App形式不适合专业开发者与企业用户 [5] - 本地部署面临五大核心痛点:AI推理算力限制、任务执行算力弹性不足、工具配置复杂、权限冲突问题、安全性差 [5][6][7][8][9] - 消费级设备无法部署高精度大模型 云端算力成为主流方案但存在弹性扩展难题 [6] - 超过43%的MCP服务节点存在未经验证Shell调用路径 83%部署存在配置漏洞 88%AI组件未启用防护机制 [9] - Agent缺乏长期记忆影响业务使用范围 语义记忆和场景记忆缺失限制任务完成能力 [10] 基础设施解决方案 - 云厂商竞相推出新一代Agent Infra架构:AWS AgentCore解决长时执行与状态记录 Azure AI Foundry集成Serverless计算 Google Vertex AI优化长时运行需求 [12] - 阿里云函数计算Function AI提供自主选择模型与工具的组装式设计 PPIO推出国内首个Agentic AI基础设施服务平台 [13] - 新一代基础设施聚焦长时运行、会话亲和、会话隔离、企业级IAM和VPC及模型框架开放等技术突破 [18] - 突破传统Serverless执行时长限制(如AWS Lambda15分钟上限)支持数分钟至数小时连续工具调用 [18][19] - 通过状态持久化、冷启动优化和开放集成解决LLM Agent持续推理、Workflow Agent状态流转和Custom Agent灵活定制需求 [22] - 开发范式从手动拼凑传统组件转向利用原生Infra实现高效安全可扩展的开发部署 [23] 市场机遇与发展趋势 - Agent Infra成为模型公司、云厂商和初创公司积极拓展领域 创业公司存在显著机会 [24] - 机会存在于现有Infra的AI-native需求环节 包括更快冷启动速度、更强隔离性及更好的AI workflow结合 [24] - 易用性高且价格合理的Infra产品有望被广泛采用 因Agent开发追求研发投入ROI [24] - 基础设施持续创新推动Agent生态共建 使开发变得像组装乐高积木一样便捷 [24]
Agent Infra 图谱:哪些组件值得为 Agent 重做一遍?
海外独角兽· 2025-05-21 20:05
核心观点 - Agent Infra需求爆发,开发范式正在重构和收敛,四大赛道值得关注:Environment、Context、Tools、Agent Security [3][13] - 创业公司机会在于:1) 在已有Infra中寻找真正Agent-native需求 2) 抓住Agent开发中新痛点 [4][5][16][17] - 云厂商积极布局但尚未出现Agent-native产品,初创公司在细分领域有差异化机会 [63][70] 投资主题1:Environment - Sandbox需满足更高性能要求:隔离性、启动速度、稳定性及AI性能如代码解释器功能 [20] - E2B提供AI-native microVM获Perplexity等头部客户认可 [20][21] - Modal提供Cloud-native虚拟机适合规模化需求 [20][21] - Browser Infra分两类:1) 大规模浏览网页 2) 深度操纵网页 [22] - Browserbase平衡带宽价格速度获开发者青睐 [23][25] - Browser Use新兴公司让Agent像人一样深度操作网页 [24][25] 投资主题2:Context - RAG已成共识技术,Glean估值近70亿美元专注企业内数据搜索 [29][30] - MCP协议标准化工具调用,早期机会在: - 自动生成MCP Server如Mintlify [31][33] - MCP connector如Composio托管100+ Server [31][33] - Marketplace价值较薄可能集成至开发端 [32] - Memory分短期/长期/程序记忆,Letta通过Sleep-time预处理提升推理质量 [34][36][38][40] 投资主题3:Tools - Search & Scraping: - Agent搜索量将远超人类,需AI-native方案 [45] - 机会在廉价API(博查)、智能搜索(Exa)、爬虫架构(Firecrawl) [45][46][47] - Finance & Payment: - Skyfire让Agent具备支付能力类比"AI经济Visa" [49][51][53] - Paid按产出定价重构货币化机制 [52][53] - Backend Workflow: - Supabase一站式后端服务吸引200万开发者 [54][56] - Inngest简化工作流编排获a16z投资 [56] 投资主题4:Agent Security - 需动态意图分析及数据校验,当前以老牌玩家为主 [57][59] - Chainguard提供安全容器镜像 [59][61] - Haize Labs压力测试增强稳健性 [59][61] - 生态完善后AI-native机会更清晰,当前偏早 [60] 云厂商布局 - Environment: - AWS Nitro Enclaves/Azure Container Apps/GCP Cloud Functions均非Agent-native [63][64][65] - Context: - AWS Bedrock/Azure Cognitive Search/GCP Vertex AI推动企业上云 [66][67] - 三大云厂商均推出MCP相关产品与A2A协议互补 [68][69] - Tools: - AWS Step Functions/Azure Logic Apps/GCP Workflows未体现Agent特性 [70][71]