文章核心观点 - 行业认为,AI Agent的规模化落地面临“跑不动、不安全、不兼容”的挑战,其根源在于传统云计算基础设施与Agent的高自主性、长会话、突发负载等原生特征存在代际错配,因此“Agent跑起来,Infra先铺路”成为共识,Agent Infra成为决定AI Agent规模化落地的关键变量[2][3][6] - 全球云厂商正将竞争焦点从模型能力转向基础设施支撑能力,Agent Infra已成为战略高地,尽管技术路径各异,但共同目标是为Agent提供更高弹性、更低延迟、更强安全、更长会话的保障,以支撑其落地千万级企业场景[7][8] - 腾讯云发布了集成了执行引擎、云沙箱、上下文服务等核心模块的Agent Runtime解决方案,体现了对Agent全生命周期管理的系统性思考,其底层性能突破(如100毫秒级沙箱启动)在行业中建立了技术领先优势[19][20][26] 市场前景与挑战 - 市场规模:据Gartner测算,2028年全球Agent市场规模将达到2850亿美元,届时15%的日常业务决策将由Agent自主完成,33%的企业软件将原生嵌入Agentic AI能力[2] - 中国市场:IDC指出,2024年中国AI Agent软件市场收入规模首次突破50亿元人民币,预计2028年将跃升至8520亿元人民币,2023~2028年复合年增长率高达72.7%,其中面向企业端的应用长期占据98%以上份额[2] - 落地挑战:当Agent投入真实的高并发业务环境时,频频陷入“跑不动、不安全、不兼容”的窘境,任务执行中断、响应迟缓、算力成本高和安全漏洞是常见问题[2] Agent的技术特征与基础设施需求 - 不确定性:Agent基于大模型的概率推理机制,其行为难以精确预测,输出结果具有不确定性,企业需通过工程手段将其控制在可接受范围内[3] - 复杂性:Agent系统中,提示词、记忆、知识库等组件相互影响且难以拆解,使得传统的单步调试方法失效,排查问题复杂[4][5] - 自主性:Agent能够自主决定调用API、执行代码或访问网站,这是其处理复杂任务的核心能力,但也带来了被恶意诱导或越权访问的安全风险,基础设施需解决如何让自主性既强大又安全的问题[6] - 基础设施代际错配:Agent“高频、轻量、突发、即时响应”的工作模式,难以被为传统应用设计的云基础设施所支撑,需要专为Agent设计的新基础设施[6][7] 主要云厂商的Agent Infra布局 - AWS:于2024年7月推出Agent Core预览版,基于Lambda FaaS深度定制全托管运行时,提供记忆管理、身份验证、代码执行等工具,专注于保障Agent运行的安全与可扩展性,支持多Agent协作[13] - 微软Azure:于2024年5月推出AI Foundry Agent Service,深度集成NVIDIA NIM微服务与AgentIQ工具包,形成从模型优化到Agent调度的全链路能力,依托Functions FaaS的事件驱动架构,支持1小时长时运行与企业级IAM权限管理[13] - 腾讯云:提出了“化解偶然复杂度”的演进逻辑,发布Agent Runtime解决方案,其核心突破在于自研的Cube(MicroVM Runtime)沙箱技术,实现了速度、安全和并发能力的提升[6][11][19] 腾讯云Agent Infra的核心技术:沙箱 - 速度突破:自研的Cube沙箱通过“运行时快照”和内存映射恢复技术,将沙箱交付时间缩短至约40毫秒,端到端启动时长稳定在100毫秒级别,达到人眨眼一次的时间量级[11][14] - 安全加强:保留了虚拟机级别的强隔离能力,每个Agent行为运行在独立、可审计、可约束的环境中,并通过“会话与实例绑定”机制,在会话结束后彻底销毁虚拟机,从根源上杜绝数据泄露风险[15] - 并发提升:通过资源提前池化,实现了单机同时拉起2000+沙箱,平台整体可瞬时调度10万级沙箱实例,采用Serverless架构让企业无需按最高负载囤积机器,资源利用率提升至80%以上,算力成本大幅降低[16][17] - 服务现状:腾讯云Agent沙箱服务已开放内测,支持代码沙箱、浏览器沙箱和计算机沙箱等多种类型,兼容主流社区开源协议以及RESTful API、SDK、CLI等多种接入方式[19] 腾讯云Agent Runtime的全栈解决方案 - 执行引擎:扮演“智能调度中心”角色,由Agent Server、MCP Server和沙箱应用三个原子化模块组成,支持会话亲和调度与实例级安全隔离,并能支持会话持续运行7天,暂停保留30天,满足长时间复杂任务需求[20] - 上下文服务:将记忆管理云化为通用服务,解决了Agent的“长期记忆”存储与检索问题,降低了企业的开发难度[21] - 网关与安全可观测:提供了从模型服务接入、工具调用流量管理,到机密计算、日志服务的全链路安全防护与可观测体系[21] - 内部生态验证:解决方案根植于腾讯内部庞大且多样化的业务生态(如微信、游戏、支付等),这些海量、复杂且高标准的内部AI化转型场景,成为了产品最好的“磨刀石”和“试验田”[22] - 应用案例:腾讯元宝的AI编程功能运行在Agent Runtime之上,实测运行速度远超同类产品;一家Agent浏览器公司引入后,沙箱启动时间提速到100毫秒级别,并能使用全球算力资源池承载十万级的Session并发创建[21][22] Agent Infra的未来演进方向 - 当前焦点:现阶段主要解决Agent“能跑起来”的问题,聚焦于安全隔离、弹性供给和极致性能等最紧迫需求[23] - 未来挑战:当Agent稳定运行后,企业需求将升级,未来需解决如何让Agent“跑得更好”的问题,包括构建评估体系、数据管理与回放、以及记忆与上下文的高阶管理能力[23][24] - 行业阶段:行业仍处于早期阶段,正处于“共识落地为行动”的初期,完备的Agent Infra新范式尚不存在[25][26] - 远期愿景:随着安全层和智能化层能力的完善,Agent Runtime有望成为一个真正意义上的“Agent操作系统”,为Agent提供标准化的运行环境和开发范式,就像iOS之于移动应用、Kubernetes之于云原生应用[25]
AI Agent落地“卡壳”?腾讯云用100毫秒沙箱打通“最后一公里”|甲子光年