Agent Infra
搜索文档
当AI已成为共识,企业究竟该如何真正“用起来”?
吴晓波频道· 2026-01-07 08:30
AI在企业落地面临的核心挑战 - 未来三年92%的企业将继续加大对AI的投资,但仅有1%的企业认为自己已达到“成熟部署”阶段[2] - AI规模化的最大障碍并非员工不会用,而是领导者的决策速度不够快,即领导层是AI落地的最大障碍[2] - AI进入企业后,考验的是战略选择、组织协同、数据与流程、治理与风控等综合内部能力,而非单纯技术能力[4] - AI竞争的关键在于谁能更快重塑企业内部的认知、组织与能力,而非谁先看见新技术[6] AI基础设施与产业生态 - 从产业角度看,模型能力已可覆盖足够多应用场景,真正的瓶颈在于模型能否被规模化应用[8] - 未来机会可分为两层基础设施:第一层是AI Infra(算力基础设施),其竞争正转向通过超大规模集群“以空间换时间”来释放模型能力[8] - 第二层是Agent Infra(智能体基础设施),它让智能体作为新的生产力单元能够被创建、调度、管理和复用[8] - 仅有算力只能解决“模型能不能跑”,而Agent Infra解决的是“模型能不能干活”的问题[8] - 未来重要的不只是模型公司或单一应用,而是围绕AI Infra和Agent Infra形成的整套产业生态[9] 企业落地AI的实践框架 - 企业落地AI需完成三件事:搭建企业知识库、要求员工根据岗位创建7-8个数字员工、优化工作流程将所有数字员工串联形成新工作流[13] - 企业知识库需沉淀所有内部制度、流程、文档和经验,供员工和数字员工调用[13] - 创建数字员工的目的是复制优秀员工能力,让普通员工借助数字员工达到优秀水平[13] - 数字员工实时响应OA、ERP的能力将使整个工作流效率发生本质变化[13] 大模型应用定位与激励挑战 - 使用大模型前需明确其定位:工具、员工、老板还是协作伙伴,这决定了后续使用方式[14] - 大模型更愿意将自己定位为协作者,而非完全替代人类的存在[14] - 大模型具备高速并行工作和人类泛化能力的优势,应研究如何用好其优势[14] - 大语言模型发展面临“激励模型”问题,需确定是对思考过程还是仅对最终结果进行激励[10] - 在数学和编程等结果可明确验证的领域AI发展快,但在法律、金融等领域,结果好坏对错难以判定和验证[10] - 若只激励最终结果,AI模型可能像人类员工一样进行“reward hacking”,使用不希望的手段达成KPI[11] 行业应用案例与模式 - 美图的增长逻辑是围绕图像与视觉处理这一核心技术,向高频、刚需的影像使用场景做乘法延展,而非盲目做加法[16] - 美图和大疆类似,都是在核心能力上不断延展新产品形态和应用场景[16] - 美图是把AI能力持续压缩进业务系统的公司,其视觉模型与营销、电商场景天然耦合,使中国企业在相关领域展现全球领先优势[18] - 通用大模型在工业和企业场景中因可靠性不足而难直接使用,其训练数据未经严格校验可能导致输出错误[19][20] - 行业正从“通用大模型”转向“智能体”,将AI拆解为嵌入具体业务环节的“数字同事”,如医疗辅助诊疗、智慧客服等[22] - 企业AI落地的关键并非“稀缺的算法天才”,而是能够管理数据、运营智能体的组织能力[24] - 通过数据制备、智能体生成平台及系统化培训,AI可被纳入企业自身能力体系[25] AI在实体产业的价值体现 - 在厦钨新能,AI作为“研发加速器”,通过构建材料数据库与模拟计算,将依赖试错的研发转变为数据驱动的精准预测[26] - 在厦门时代,AI作为“产线优化师”,通过实时监测分析生产数据,提前预警质量波动并自动调节工艺参数[27] - AI在实体产业的真正价值在于消除生产与研发环节的“不确定性”,并对“效率与质量”进行深层重构[28] 企业成功应用AI的关键共识 - AI的难题已不在模型参数,而在企业内部,考验的是能否建立一套AI落地体系,把试点变流程、工具变机制[32] - AI转型的关键不是买工具、堆系统或技术外包,而是先拉齐组织认知、搭建能力框架,确保有人能理解、管理和运营AI[32] - 真正拉开企业差距的,往往不是谁更早拥抱技术,而是谁更早把能力沉淀进组织[34] - 技术决定上限,组织决定结果[33]
Agent Infra 吃掉 Manus
36氪· 2026-01-04 13:42
文章核心观点 - 大厂通过构建Agent Infra(智能体底座)正在对AI Agent领域进行“合法入室”和“清场”,将基础设施标准化、成本极致化,并掌控核心权限与安全标准,这导致独立的Agent应用价值被侵蚀,未来将“功能化”并融入各类垂直业务场景[2][7][22][23] - 对于创业者而言,未来的机会不在于与大厂竞争基础设施,而在于深挖无法被标准化的垂直行业业务潜规则(Know-how),并将Agent能力像“盐溶于水”一样嵌入到企业的具体业务流程中[8][11][25][26] Agent Infra的定义与战略意图 - Agent Infra被比喻为AI时代的操作系统,向下管理算力调度,向上为各种任务提供引擎,是支撑Agent运行的“路、红绿灯、加油站”[1] - 大厂布局Infra的核心战略是重新定义领域的“房东”,通过收购Manus等激进操作直接切入最底层的地基环节,改变游戏规则[2] - 大厂推行MCP(模型上下文协议)等标准,旨在底层修建“高速公路收费站”,收编接口,使创业者过去依赖的非标接口和脚本构建的壁垒价值大幅降低[3][4] 大厂构建的壁垒与不对等优势 - **接口标准化收编**:大厂通过Infra制定规矩,要求第三方服务向其地基靠拢,使创业者辛苦对接的私有接口价值缩水[3] - **权限控制**:大厂掌握基于微型虚拟机的原生沙箱隔离技术,使其Agent拥有“系统级权限”,能直接调用底层资源,而创业者的Agent则像权限受限的“外来户”[5] - **成本优势**:大厂通过Serverless GPU等“算力自来水”技术,将GPU资源碎片化并按需调度,可将单次任务成本降至原来的十分之一甚至百分之一[20][21] - **建立信任与安全**:大厂在Infra层构建全流程的“审计链”,记录Agent的每一步操作,并配备熔断机制,以解决企业对于Agent安全可控的信任问题[15][16] 对创业者和行业的影响 - **独立Agent应用价值衰减**:当执行引擎、工具协议、安全沙箱和廉价算力都被封装进大厂地基后,Agent可能不再是一个独立应用,而会退化为操作系统中的一个右键菜单或业务系统中的一个无感按钮[6][22][23] - **通用Agent能力贬值**:依靠大厂Infra,调用通用接口(如订机票)的能力将变得廉价且易得[8][9] - **垂直行业Know-how价值凸显**:真正值钱的是理解特定行业“业务潜规则”的能力,例如跨国贸易中的税务优化路径、医疗报销中的地方政策差异、制造业中的供应链替代方案等,这些是大厂通用Infra无法提供的[9][11] - **中间商模式受冲击**:依靠“赚Token差价”或“套壳封装”的商业模式将难以持续,因为算力正变成像自来水一样的廉价基建[22] 给创业者的生存建议 - **放弃基建幻想**:不应再投入Runtime、沙箱、通用协议等基础设施,这些已成为大厂标准化的“水电煤”[25] - **深挖业务潜规则**:寻找Infra无法进入的“深水区”,那些无法被标准化、甚至带点灰色的行业SOP(标准作业程序),才是创业者的核心价值与“租金”来源[25][26] - **拥抱“功能化”**:不再执着于开发独立的Agent应用,而是将能力像盐一样溶解并嵌入企业的知识库、数据库和具体业务流中[25][26] 成本与案例数据 - 一个普通的复杂Agent任务运行成本约为2美元[18] - Manus在尝试制作一个简单的网页版数独游戏时,耗光了1300积分,相当于花费13美元仍未完成任务[18] - 大厂通过Serverless GPU等技术,可将单次任务成本压至原来的十分之一甚至百分之一[21]
AI Agent 很火,但 Agent Infra 准备好了吗?
Founder Park· 2025-12-25 17:04
文章核心观点 - 基础设施软件的主要使用者正从人类开发者转变为AI Agent,这要求基础设施的架构范式发生根本性变革,以支持AI Agent的自主、高并发、低延迟和不确定性任务处理 [1] - 当前的基础设施仍主要为人类开发者设计,无法满足AI Agent的需求,因此面向“原生智能体”的基础设施建设将成为未来的关键门槛和巨大市场机会 [1][3] - AI Agent的开发和落地范式与传统App完全不同,其核心区别在于系统从确定性转向概率性,这要求工程思维、基础设施和商业模式进行彻底重塑 [3][4][6] Agent Infra 与传统软件工程的根本区别 - **核心区别在于不确定性**:传统软件依赖确定的if/else逻辑,而AI Agent依赖概率性目标规划和提示词调教,其行为更像教育孩子而非修复水管 [4] - **系统性质发生改变**:AI Agent是由模型、提示词、上下文等多因素共同决定效果的“不确定性的复杂系统”,而传统的微服务是调用关系清晰的“确定性简单系统” [6] - **交付物与工作方式转变**:传统工程交付确定的功能,判断标准非对即错;AI Agent工程交付的是一种概率性能力,工程师需要从追求确定性转向驾驭不确定性 [6][7] Agent Infra 的定义、现状与挑战 - **定义尚未明确**:Agent Infra的边界尚未完全定型,其核心作用是帮助解决AI Agent落地过程中的“偶然复杂度”,但不同应用场景的偶然复杂度差异巨大 [11] - **解决公共的偶然复杂度**:行业领先者正聚焦于所有场景下偶然复杂度的“最大公共子集”,包括安全问题、执行环境、工具体系、记忆管理和可观测性 [11] - **安全沙箱是突出需求**:由于AI Agent自主运行带来的风险,全方位的安全沙箱服务成为关键,需从虚拟化、网络和凭证层面限制其操作边界 [12] - **完备范式尚未出现**:当前云厂商提供的Agent Infra产品多是从上一代技术演进而来,并非基于全新范式思考,行业仍在探索完备的Agent Infra形态 [15][16] 当前Agent Infra的主要服务场景 - **主要应用方向**:根据LangChain报告,客户服务、研究与数据分析是当前Agent最火热的两大应用方向 [17] - **具体服务场景**:主要包括Vibe Coding、深度研究与数据处理、GUI Agent以及强化学习场景,这些场景普遍依赖云端沙箱环境来实现安全隔离与资源弹性 [18][19] - **开发者核心需求**:开发者对Agent Infra的需求聚焦于极致的使用体验和完善的生态兼容性,以降低开发成本,统一的API标准至关重要 [20] 行业参与者的实践与优势 - **腾讯云的实践**:腾讯云推出了Agent Runtime解决方案,其沙箱服务实现了全球领先的80毫秒启动速度,这依赖于从底层计算到调度层的全栈深度优化 [21][22] - **显著的效益提升**:腾讯内部一些Agent产品从传统方案切换到Agent Runtime沙箱后,成本节省了90%以上 [23] - **性能标杆**:在典型应用生成场景中,Agent Runtime能做到端到端200毫秒的全流程响应,而全球多数同类产品需要秒级等待 [24] Agent Infra 的未来重点与创业机会 - **下一阶段技术重点**:可调试性、语义化的情景记忆管理以及支撑实时交互的低延迟性能是未来的发展重点 [27][29] - **核心演进方向**:Agent Infra需要完成从“服务Agent的构建与运行”到“服务Agent的智能进化”的跨越,即利用Agent产生的真实业务数据反哺模型与Agent的迭代优化,形成智能进化闭环 [30][31][32] - **创业机会存在**:在范式标准未明确时,并非只是大厂的赛道,谁能更快更好地支持Agent的特性需求,谁就有可能更快占领市场 [26] - **商业模式变革**:AI Agent极大地民主化了“计算”,降低了原型验证和开发的边际成本,使得许多过去不经济的商业模式变得可行 [26]
智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify
量子位· 2025-12-23 12:16
文章核心观点 - 2025年被定义为“Agent元年”,行业焦点从年初的宏大叙事转向年末的工程化落地,Agent正从技术萌芽走向务实应用 [1][2][3] - Agent的快速共识源于其能真正解决问题,并伴随一系列工程方法(如Agent Infra、Runtime、架构范式)的快速成型,实现了落地 [12] - Agent落地面临的核心挑战是其作为一个“不确定性的复杂系统”,需要确定性的工程方法(如科学实验思维、Day Two思维)来驾驭 [6][19][20] - Agent Infra是智能体落地的关键一环,它通过解决安全、执行环境、工具、记忆和观测等“偶然复杂度”问题,为Agent的可靠运行和智能进化提供支撑 [5][23][38] Agent发展阶段的总结 - Agent发展已从年初硅谷的“宏大叙事”和“立法阶段”(靠Demo吸引资本),进入年末充满“烟火气”的“司法阶段”,处理具体、琐碎的执行问题,走向务实 [6][9][10][11] - 行业发展并非线性进步,而是“根茎状的蔓延”,秩序的建立更多依赖于产品工程、提示词工程、RAG、Pipeline等“胶水”技术 [12] - 共识的形成部分源于资本在互联网红利见顶后,寻求新的组织方式,Agent承诺了“交互成本的坍塌” [12][13] Agent落地与AI落地的区别 - 范式发生明显转移:从传统的if/else逻辑判断和确定性功能交付,转向Agent的“概率性目标规划”和“概率性能力”交付 [14][18] - 关键区别在于“新增了很多不确定性”:Agent的失败是对意图的误解或概率漂移,修复方式从“修Bug”变为像“教育孩子”一样进行约束 [18] - Agent是一个由模型、架构、Prompt、工具等七八个因素相互影响构成的“不确定性的复杂系统”,其输出具有不确定性,与传统微服务系统相反 [19] Agent Infra的角色与关键要素 - Agent Infra的核心作用是解决企业在Agent落地中遇到的“偶然复杂度”问题,而非业务本身的本质复杂度 [6][23] - 当前Infra层致力于构建解决偶然复杂度问题的“最大公共子集”,包括:安全、执行环境、工具、记忆和观测 [23] - 在Agent Infra中,“安全”尤其是“Agent的自主运行”带来的破坏性风险是最突出的问题,需要多层次、全链路的安全体系(如安全沙箱)来解决 [21][25][26] - 对于Infra的开闭源选择呈现分层互补:初创公司和创新者倾向于开源以获得低成本、灵活性和透明度(白箱);大企业则倾向于商业版或闭源以获得责任转移与兜底服务 [27][28][29] 技术进展与未来趋势 - **AI代码工具**成为标志性实践和重要趋势:它不仅是解决代码问题的工具,更成为Agent连接现实世界的通用接口,并颠覆了原有的软件工程范式,推动从AI Coding到AISE(AI软件工程师)的转变 [7][33][34] - 技术正在从开发者向非开发者移动,简化程度逼近“AI开发的Excel时刻”,将基础设施认知负荷降至最低,使开发者能聚焦于Prompt和数据治理 [31][35] - Agent Infra的下一步重点是从“服务好Agent的运行构建”转向“服务好Agent的智能进化”,关注其安全可靠运行,并利用运行数据持续优化Agent本身和模型 [38] - 未来重点方向可概括为:**秩序**(让混乱模型可控)、**连接**(打通Agent孤岛融入业务)、**自动**(任务自动化)、**安全高效**、**智能进化**、**人机协同** [39] - 记忆管理需要超越简单的向量搜索,关注语义化的情景记忆和可计算的时间观,将记忆和目标视为可重写、降级的变量并进行置信度处理 [40] 对开发者和企业的影响与门槛 - 对于中小公司和个人开发者,最大的门槛并非技术或成本,而是**缺乏开始的勇气**以及企业**数据的壁垒**;同时,**商业模式**的探索和转变是关键,因Agent尚未到全面改变社会商业模式的阶段 [6][40] - 对于专业开发者和AI原生企业,Infra产品主要帮助治理其面临的复杂问题,加速Agent落地 [31] - 若Agent成为主流,将对移动开发生态产生影响:公司会要求在APP中集成Agent能力,促使开发者思维从工程转向科学实验;利用AI Coding工具开发APP则要求改变协同模式和工具体系 [41][44] - 未来的应用交互形态(如iOS/Android)尚无定论,但只有那些与AI工具为伍、改造研发流程并用科学实验思维驾驭不确定性的人,才能抓住形态转移的机遇 [42][43]
Agent应用爆发,谁成为向上托举的力量?
36氪· 2025-08-06 18:31
AI Agent发展现状 - AI Agent正从被动响应迈向主动决策 成为连接数字世界与物理世界的核心枢纽 [1] - 具备推理、规划、记忆与工具使用能力的智能体正在重塑产业形态 涵盖企业Agent、学术Agent和个人Agent [1] - 2025年AI Agentic基础设施迎来爆发拐点 开源大模型突破提供认知"大脑" 模型上下文协议生态繁荣赋予灵活"四肢" [1] - 全球80%企业将在年内部署Agent 大脑与四肢的协同进化倒逼基础设施全面升级 [1] 企业应用痛点 - 早期RPA产品只能自动化简单单一工作流程 不具备真正智能且不能解决复合化复杂问题 [3][4] - 生成式AI出现后真正具备智能的Agent应用带来效率提升 但网页或App形式不适合专业开发者与企业用户 [5] - 本地部署面临五大核心痛点:AI推理算力限制、任务执行算力弹性不足、工具配置复杂、权限冲突问题、安全性差 [5][6][7][8][9] - 消费级设备无法部署高精度大模型 云端算力成为主流方案但存在弹性扩展难题 [6] - 超过43%的MCP服务节点存在未经验证Shell调用路径 83%部署存在配置漏洞 88%AI组件未启用防护机制 [9] - Agent缺乏长期记忆影响业务使用范围 语义记忆和场景记忆缺失限制任务完成能力 [10] 基础设施解决方案 - 云厂商竞相推出新一代Agent Infra架构:AWS AgentCore解决长时执行与状态记录 Azure AI Foundry集成Serverless计算 Google Vertex AI优化长时运行需求 [12] - 阿里云函数计算Function AI提供自主选择模型与工具的组装式设计 PPIO推出国内首个Agentic AI基础设施服务平台 [13] - 新一代基础设施聚焦长时运行、会话亲和、会话隔离、企业级IAM和VPC及模型框架开放等技术突破 [18] - 突破传统Serverless执行时长限制(如AWS Lambda15分钟上限)支持数分钟至数小时连续工具调用 [18][19] - 通过状态持久化、冷启动优化和开放集成解决LLM Agent持续推理、Workflow Agent状态流转和Custom Agent灵活定制需求 [22] - 开发范式从手动拼凑传统组件转向利用原生Infra实现高效安全可扩展的开发部署 [23] 市场机遇与发展趋势 - Agent Infra成为模型公司、云厂商和初创公司积极拓展领域 创业公司存在显著机会 [24] - 机会存在于现有Infra的AI-native需求环节 包括更快冷启动速度、更强隔离性及更好的AI workflow结合 [24] - 易用性高且价格合理的Infra产品有望被广泛采用 因Agent开发追求研发投入ROI [24] - 基础设施持续创新推动Agent生态共建 使开发变得像组装乐高积木一样便捷 [24]
Agent Infra 图谱:哪些组件值得为 Agent 重做一遍?
海外独角兽· 2025-05-21 20:05
核心观点 - Agent Infra需求爆发,开发范式正在重构和收敛,四大赛道值得关注:Environment、Context、Tools、Agent Security [3][13] - 创业公司机会在于:1) 在已有Infra中寻找真正Agent-native需求 2) 抓住Agent开发中新痛点 [4][5][16][17] - 云厂商积极布局但尚未出现Agent-native产品,初创公司在细分领域有差异化机会 [63][70] 投资主题1:Environment - Sandbox需满足更高性能要求:隔离性、启动速度、稳定性及AI性能如代码解释器功能 [20] - E2B提供AI-native microVM获Perplexity等头部客户认可 [20][21] - Modal提供Cloud-native虚拟机适合规模化需求 [20][21] - Browser Infra分两类:1) 大规模浏览网页 2) 深度操纵网页 [22] - Browserbase平衡带宽价格速度获开发者青睐 [23][25] - Browser Use新兴公司让Agent像人一样深度操作网页 [24][25] 投资主题2:Context - RAG已成共识技术,Glean估值近70亿美元专注企业内数据搜索 [29][30] - MCP协议标准化工具调用,早期机会在: - 自动生成MCP Server如Mintlify [31][33] - MCP connector如Composio托管100+ Server [31][33] - Marketplace价值较薄可能集成至开发端 [32] - Memory分短期/长期/程序记忆,Letta通过Sleep-time预处理提升推理质量 [34][36][38][40] 投资主题3:Tools - Search & Scraping: - Agent搜索量将远超人类,需AI-native方案 [45] - 机会在廉价API(博查)、智能搜索(Exa)、爬虫架构(Firecrawl) [45][46][47] - Finance & Payment: - Skyfire让Agent具备支付能力类比"AI经济Visa" [49][51][53] - Paid按产出定价重构货币化机制 [52][53] - Backend Workflow: - Supabase一站式后端服务吸引200万开发者 [54][56] - Inngest简化工作流编排获a16z投资 [56] 投资主题4:Agent Security - 需动态意图分析及数据校验,当前以老牌玩家为主 [57][59] - Chainguard提供安全容器镜像 [59][61] - Haize Labs压力测试增强稳健性 [59][61] - 生态完善后AI-native机会更清晰,当前偏早 [60] 云厂商布局 - Environment: - AWS Nitro Enclaves/Azure Container Apps/GCP Cloud Functions均非Agent-native [63][64][65] - Context: - AWS Bedrock/Azure Cognitive Search/GCP Vertex AI推动企业上云 [66][67] - 三大云厂商均推出MCP相关产品与A2A协议互补 [68][69] - Tools: - AWS Step Functions/Azure Logic Apps/GCP Workflows未体现Agent特性 [70][71]