Agent Infra
搜索文档
当AI已成为共识,企业究竟该如何真正“用起来”?
吴晓波频道· 2026-01-07 08:30
AI在企业落地面临的核心挑战 - 未来三年92%的企业将继续加大对AI的投资,但仅有1%的企业认为自己已达到“成熟部署”阶段[2] - AI规模化的最大障碍并非员工不会用,而是领导者的决策速度不够快,即领导层是AI落地的最大障碍[2] - AI进入企业后,考验的是战略选择、组织协同、数据与流程、治理与风控等综合内部能力,而非单纯技术能力[4] - AI竞争的关键在于谁能更快重塑企业内部的认知、组织与能力,而非谁先看见新技术[6] AI基础设施与产业生态 - 从产业角度看,模型能力已可覆盖足够多应用场景,真正的瓶颈在于模型能否被规模化应用[8] - 未来机会可分为两层基础设施:第一层是AI Infra(算力基础设施),其竞争正转向通过超大规模集群“以空间换时间”来释放模型能力[8] - 第二层是Agent Infra(智能体基础设施),它让智能体作为新的生产力单元能够被创建、调度、管理和复用[8] - 仅有算力只能解决“模型能不能跑”,而Agent Infra解决的是“模型能不能干活”的问题[8] - 未来重要的不只是模型公司或单一应用,而是围绕AI Infra和Agent Infra形成的整套产业生态[9] 企业落地AI的实践框架 - 企业落地AI需完成三件事:搭建企业知识库、要求员工根据岗位创建7-8个数字员工、优化工作流程将所有数字员工串联形成新工作流[13] - 企业知识库需沉淀所有内部制度、流程、文档和经验,供员工和数字员工调用[13] - 创建数字员工的目的是复制优秀员工能力,让普通员工借助数字员工达到优秀水平[13] - 数字员工实时响应OA、ERP的能力将使整个工作流效率发生本质变化[13] 大模型应用定位与激励挑战 - 使用大模型前需明确其定位:工具、员工、老板还是协作伙伴,这决定了后续使用方式[14] - 大模型更愿意将自己定位为协作者,而非完全替代人类的存在[14] - 大模型具备高速并行工作和人类泛化能力的优势,应研究如何用好其优势[14] - 大语言模型发展面临“激励模型”问题,需确定是对思考过程还是仅对最终结果进行激励[10] - 在数学和编程等结果可明确验证的领域AI发展快,但在法律、金融等领域,结果好坏对错难以判定和验证[10] - 若只激励最终结果,AI模型可能像人类员工一样进行“reward hacking”,使用不希望的手段达成KPI[11] 行业应用案例与模式 - 美图的增长逻辑是围绕图像与视觉处理这一核心技术,向高频、刚需的影像使用场景做乘法延展,而非盲目做加法[16] - 美图和大疆类似,都是在核心能力上不断延展新产品形态和应用场景[16] - 美图是把AI能力持续压缩进业务系统的公司,其视觉模型与营销、电商场景天然耦合,使中国企业在相关领域展现全球领先优势[18] - 通用大模型在工业和企业场景中因可靠性不足而难直接使用,其训练数据未经严格校验可能导致输出错误[19][20] - 行业正从“通用大模型”转向“智能体”,将AI拆解为嵌入具体业务环节的“数字同事”,如医疗辅助诊疗、智慧客服等[22] - 企业AI落地的关键并非“稀缺的算法天才”,而是能够管理数据、运营智能体的组织能力[24] - 通过数据制备、智能体生成平台及系统化培训,AI可被纳入企业自身能力体系[25] AI在实体产业的价值体现 - 在厦钨新能,AI作为“研发加速器”,通过构建材料数据库与模拟计算,将依赖试错的研发转变为数据驱动的精准预测[26] - 在厦门时代,AI作为“产线优化师”,通过实时监测分析生产数据,提前预警质量波动并自动调节工艺参数[27] - AI在实体产业的真正价值在于消除生产与研发环节的“不确定性”,并对“效率与质量”进行深层重构[28] 企业成功应用AI的关键共识 - AI的难题已不在模型参数,而在企业内部,考验的是能否建立一套AI落地体系,把试点变流程、工具变机制[32] - AI转型的关键不是买工具、堆系统或技术外包,而是先拉齐组织认知、搭建能力框架,确保有人能理解、管理和运营AI[32] - 真正拉开企业差距的,往往不是谁更早拥抱技术,而是谁更早把能力沉淀进组织[34] - 技术决定上限,组织决定结果[33]
AI Agent落地“卡壳”?腾讯云用100毫秒沙箱打通“最后一公里”|甲子光年
搜狐财经· 2025-12-26 15:25
文章核心观点 - 行业认为,AI Agent的规模化落地面临“跑不动、不安全、不兼容”的挑战,其根源在于传统云计算基础设施与Agent的高自主性、长会话、突发负载等原生特征存在代际错配,因此“Agent跑起来,Infra先铺路”成为共识,Agent Infra成为决定AI Agent规模化落地的关键变量[2][3][6] - 全球云厂商正将竞争焦点从模型能力转向基础设施支撑能力,Agent Infra已成为战略高地,尽管技术路径各异,但共同目标是为Agent提供更高弹性、更低延迟、更强安全、更长会话的保障,以支撑其落地千万级企业场景[7][8] - 腾讯云发布了集成了执行引擎、云沙箱、上下文服务等核心模块的Agent Runtime解决方案,体现了对Agent全生命周期管理的系统性思考,其底层性能突破(如100毫秒级沙箱启动)在行业中建立了技术领先优势[19][20][26] 市场前景与挑战 - **市场规模**:据Gartner测算,2028年全球Agent市场规模将达到2850亿美元,届时15%的日常业务决策将由Agent自主完成,33%的企业软件将原生嵌入Agentic AI能力[2] - **中国市场**:IDC指出,2024年中国AI Agent软件市场收入规模首次突破50亿元人民币,预计2028年将跃升至8520亿元人民币,2023~2028年复合年增长率高达72.7%,其中面向企业端的应用长期占据98%以上份额[2] - **落地挑战**:当Agent投入真实的高并发业务环境时,频频陷入“跑不动、不安全、不兼容”的窘境,任务执行中断、响应迟缓、算力成本高和安全漏洞是常见问题[2] Agent的技术特征与基础设施需求 - **不确定性**:Agent基于大模型的概率推理机制,其行为难以精确预测,输出结果具有不确定性,企业需通过工程手段将其控制在可接受范围内[3] - **复杂性**:Agent系统中,提示词、记忆、知识库等组件相互影响且难以拆解,使得传统的单步调试方法失效,排查问题复杂[4][5] - **自主性**:Agent能够自主决定调用API、执行代码或访问网站,这是其处理复杂任务的核心能力,但也带来了被恶意诱导或越权访问的安全风险,基础设施需解决如何让自主性既强大又安全的问题[6] - **基础设施代际错配**:Agent“高频、轻量、突发、即时响应”的工作模式,难以被为传统应用设计的云基础设施所支撑,需要专为Agent设计的新基础设施[6][7] 主要云厂商的Agent Infra布局 - **AWS**:于2024年7月推出Agent Core预览版,基于Lambda FaaS深度定制全托管运行时,提供记忆管理、身份验证、代码执行等工具,专注于保障Agent运行的安全与可扩展性,支持多Agent协作[13] - **微软Azure**:于2024年5月推出AI Foundry Agent Service,深度集成NVIDIA NIM微服务与AgentIQ工具包,形成从模型优化到Agent调度的全链路能力,依托Functions FaaS的事件驱动架构,支持1小时长时运行与企业级IAM权限管理[13] - **腾讯云**:提出了“化解偶然复杂度”的演进逻辑,发布Agent Runtime解决方案,其核心突破在于自研的Cube(MicroVM Runtime)沙箱技术,实现了速度、安全和并发能力的提升[6][11][19] 腾讯云Agent Infra的核心技术:沙箱 - **速度突破**:自研的Cube沙箱通过“运行时快照”和内存映射恢复技术,将沙箱交付时间缩短至约40毫秒,端到端启动时长稳定在100毫秒级别,达到人眨眼一次的时间量级[11][14] - **安全加强**:保留了虚拟机级别的强隔离能力,每个Agent行为运行在独立、可审计、可约束的环境中,并通过“会话与实例绑定”机制,在会话结束后彻底销毁虚拟机,从根源上杜绝数据泄露风险[15] - **并发提升**:通过资源提前池化,实现了单机同时拉起2000+沙箱,平台整体可瞬时调度10万级沙箱实例,采用Serverless架构让企业无需按最高负载囤积机器,资源利用率提升至80%以上,算力成本大幅降低[16][17] - **服务现状**:腾讯云Agent沙箱服务已开放内测,支持代码沙箱、浏览器沙箱和计算机沙箱等多种类型,兼容主流社区开源协议以及RESTful API、SDK、CLI等多种接入方式[19] 腾讯云Agent Runtime的全栈解决方案 - **执行引擎**:扮演“智能调度中心”角色,由Agent Server、MCP Server和沙箱应用三个原子化模块组成,支持会话亲和调度与实例级安全隔离,并能支持会话持续运行7天,暂停保留30天,满足长时间复杂任务需求[20] - **上下文服务**:将记忆管理云化为通用服务,解决了Agent的“长期记忆”存储与检索问题,降低了企业的开发难度[21] - **网关与安全可观测**:提供了从模型服务接入、工具调用流量管理,到机密计算、日志服务的全链路安全防护与可观测体系[21] - **内部生态验证**:解决方案根植于腾讯内部庞大且多样化的业务生态(如微信、游戏、支付等),这些海量、复杂且高标准的内部AI化转型场景,成为了产品最好的“磨刀石”和“试验田”[22] - **应用案例**:腾讯元宝的AI编程功能运行在Agent Runtime之上,实测运行速度远超同类产品;一家Agent浏览器公司引入后,沙箱启动时间提速到100毫秒级别,并能使用全球算力资源池承载十万级的Session并发创建[21][22] Agent Infra的未来演进方向 - **当前焦点**:现阶段主要解决Agent“能跑起来”的问题,聚焦于安全隔离、弹性供给和极致性能等最紧迫需求[23] - **未来挑战**:当Agent稳定运行后,企业需求将升级,未来需解决如何让Agent“跑得更好”的问题,包括构建评估体系、数据管理与回放、以及记忆与上下文的高阶管理能力[23][24] - **行业阶段**:行业仍处于早期阶段,正处于“共识落地为行动”的初期,完备的Agent Infra新范式尚不存在[25][26] - **远期愿景**:随着安全层和智能化层能力的完善,Agent Runtime有望成为一个真正意义上的“Agent操作系统”,为Agent提供标准化的运行环境和开发范式,就像iOS之于移动应用、Kubernetes之于云原生应用[25]
AI Agent 很火,但 Agent Infra 准备好了吗?
Founder Park· 2025-12-25 17:04
文章核心观点 - 基础设施软件的主要使用者正从人类开发者转变为AI Agent,这要求基础设施的架构范式发生根本性变革,以支持AI Agent的自主、高并发、低延迟和不确定性任务处理 [1] - 当前的基础设施仍主要为人类开发者设计,无法满足AI Agent的需求,因此面向“原生智能体”的基础设施建设将成为未来的关键门槛和巨大市场机会 [1][3] - AI Agent的开发和落地范式与传统App完全不同,其核心区别在于系统从确定性转向概率性,这要求工程思维、基础设施和商业模式进行彻底重塑 [3][4][6] Agent Infra 与传统软件工程的根本区别 - **核心区别在于不确定性**:传统软件依赖确定的if/else逻辑,而AI Agent依赖概率性目标规划和提示词调教,其行为更像教育孩子而非修复水管 [4] - **系统性质发生改变**:AI Agent是由模型、提示词、上下文等多因素共同决定效果的“不确定性的复杂系统”,而传统的微服务是调用关系清晰的“确定性简单系统” [6] - **交付物与工作方式转变**:传统工程交付确定的功能,判断标准非对即错;AI Agent工程交付的是一种概率性能力,工程师需要从追求确定性转向驾驭不确定性 [6][7] Agent Infra 的定义、现状与挑战 - **定义尚未明确**:Agent Infra的边界尚未完全定型,其核心作用是帮助解决AI Agent落地过程中的“偶然复杂度”,但不同应用场景的偶然复杂度差异巨大 [11] - **解决公共的偶然复杂度**:行业领先者正聚焦于所有场景下偶然复杂度的“最大公共子集”,包括安全问题、执行环境、工具体系、记忆管理和可观测性 [11] - **安全沙箱是突出需求**:由于AI Agent自主运行带来的风险,全方位的安全沙箱服务成为关键,需从虚拟化、网络和凭证层面限制其操作边界 [12] - **完备范式尚未出现**:当前云厂商提供的Agent Infra产品多是从上一代技术演进而来,并非基于全新范式思考,行业仍在探索完备的Agent Infra形态 [15][16] 当前Agent Infra的主要服务场景 - **主要应用方向**:根据LangChain报告,客户服务、研究与数据分析是当前Agent最火热的两大应用方向 [17] - **具体服务场景**:主要包括Vibe Coding、深度研究与数据处理、GUI Agent以及强化学习场景,这些场景普遍依赖云端沙箱环境来实现安全隔离与资源弹性 [18][19] - **开发者核心需求**:开发者对Agent Infra的需求聚焦于极致的使用体验和完善的生态兼容性,以降低开发成本,统一的API标准至关重要 [20] 行业参与者的实践与优势 - **腾讯云的实践**:腾讯云推出了Agent Runtime解决方案,其沙箱服务实现了全球领先的80毫秒启动速度,这依赖于从底层计算到调度层的全栈深度优化 [21][22] - **显著的效益提升**:腾讯内部一些Agent产品从传统方案切换到Agent Runtime沙箱后,成本节省了90%以上 [23] - **性能标杆**:在典型应用生成场景中,Agent Runtime能做到端到端200毫秒的全流程响应,而全球多数同类产品需要秒级等待 [24] Agent Infra 的未来重点与创业机会 - **下一阶段技术重点**:可调试性、语义化的情景记忆管理以及支撑实时交互的低延迟性能是未来的发展重点 [27][29] - **核心演进方向**:Agent Infra需要完成从“服务Agent的构建与运行”到“服务Agent的智能进化”的跨越,即利用Agent产生的真实业务数据反哺模型与Agent的迭代优化,形成智能进化闭环 [30][31][32] - **创业机会存在**:在范式标准未明确时,并非只是大厂的赛道,谁能更快更好地支持Agent的特性需求,谁就有可能更快占领市场 [26] - **商业模式变革**:AI Agent极大地民主化了“计算”,降低了原型验证和开发的边际成本,使得许多过去不经济的商业模式变得可行 [26]
AI版街边游戏,重塑中国烟火气
36氪· 2025-12-17 11:30
核心观点 - AI技术正以多种“接地气”的应用形式渗透并改造中国的“地摊经济”或线下小微商业场景,其核心价值在于通过个性化、趣味性和低门槛的解决方案,为传统街头商业增添新活力并创造新的消费体验 [1][4][23] AI在街头巷尾的具体应用案例 - **AI调香**:在集市展会上,通过小程序嵌入文心大模型,用户输入姓名和MBTI人格即可生成专属香水配方,旨在提供个性化、有趣的体验,目前用于试错并验证需求 [2][4] - **AI手串**:在北京潘家园古玩市场,摊贩通过植入NFC芯片的珠子,让顾客用手机触碰即可根据姓名和方位接收每日运气,已售出1万多个 [5][9] - **AI台球**:在广东出现,通过在球桌上方安装投影仪和摄像头,利用算法识别并投影进球路线,辅助练习,收费为每小时40-50元起步 [6][9] - **AI象棋/五子棋**:在广东街头出现,使用机械臂与人对弈,成人收费5元/盘,儿童免费 [8][9] - **AI理发**:理发店尝试利用大模型(如千问)通过视频通话分析用户头型并推荐发型 [8] AI地摊经济的商业模式与创业成本 - **加盟模式(高成本)**:创业者通过加盟垂类大模型公司(如AI台球、AI KTV)的产品进入市场,前期投入需数十万元起,盈利受地理位置、经营能力和消费者新鲜感持续时间影响 [11][12] - **硬件零售模式(低成本)**:创业者购买现成的AI智能硬件(如AI象棋机器人,价格在500至2000多元不等)进行小成本创业,盈利同样依赖客流和新鲜感 [13] - **自开发模式(低门槛)**:无编码基础的创业者利用傻瓜型AI开发工具(如秒哒、京东云JoyBuilder、字节扣子、阿里Dify等)快速搭建应用,大幅降低了开发成本,例如AI调香小程序的开发无需专业程序员 [16][17] 行业技术基础与发展阶段 - **基础大模型基建完成**:中国已拥有众多参数超1000亿的基础大模型,为垂类模型和应用提供了肥沃土壤 [11] - **进入AI Agent基建(Agent Infra)阶段**:行业正从大模型基建迈向AI Agent基建和智能体应用时代,这是当前AI地摊经济涌现的技术背景 [20] - **Agent协作支撑应用**:复杂的AI应用(如AI调香小程序、数字人直播)背后由多个专业智能体(如需求分析、开发执行、测试优化)协作完成,实现了无需专业开发者的快速搭建 [20][21] - **大厂发力Agent基础设施**:为保障智能体运行稳定、低价,阿里云推出了无影AgentBay,腾讯云推出了Agent Runtime等Agent Infra基础设施 [22]
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026
量子位· 2025-12-15 18:33
AI行业趋势:迈向Agentic AI时代 - AI行业正从生成式AI迈向自主执行和创造的Agentic AI时代,这被视为真正的落地元年,正在改变应用形态并重塑AI技术栈的底层逻辑[1] - 未来的AI应用将从回答问题的工具转向能够直接完成任务的助手,行业迫切需要一种新的基础设施——Agent时代的操作系统[2] - 智能体将成为未来AI应用的主力,而Agent Infra将成为下一个AI时代的操作系统,其核心目标是通过新的Runtime体系,实现模型能力、工具能力与执行能力的高度融合[3] 智能体的定义与演进 - 行业正从Generative AI向Agent AI进步,标志性产品如豆包手机能够自动下单、比价比价和执行任务,展示了AI应用像智能体一样自动化完成任务和进行创作[8] - 当前行业内许多人将智能体定位为工作流,但早期的编排工具(如扣子)或具备Deep Research功能的AI工具只是智能体的早期形态,并非完全体[9][10][11] - 真正的完全态智能体需要具备自主分析、自主决策以及自动化完成任务的能力,其核心在于执行与落地环节[11] - 真正的智能体需要从能力堆叠走向系统化结构,它需要全新的架构和形态,不能依赖旧式应用或工作流体系[12][13] 智能体的核心架构与组件 - 根据OpenAI研究员的论文,真正的智能体包含四个核心组件:记忆、规划、工具和行动[14][15] - 在数字生命体类比中,记忆类似于大脑的记忆功能,负责短期和长期记忆;规划更像思考单元,负责深度推理和分析;工具和行动则类似于感知和影响外部世界的五官与手脚[17] - 真正的智能体是一个具备从思考到执行再到分析的综合系统,而不仅仅是执行机器[17] Agent Infra:AI时代的操作系统 - 智能体的基础设施更像操作系统,它是管理异构资源、抽象标准化功能调用的核心中间层,这一角色在PC、移动和云时代都未改变[18][21][22] - Agent Infra本质上是构建AI时代的操作系统,它管理的资源是模型能力、工具调用能力以及任务和执行能力,并完成资源管理、统一调度与抽象,以方便上层应用构建[23] - 在整个Agent Infra体系中,最核心的部分是Runtime,它解决智能体“能否跑起来”的问题,确保其能在各种环境下大规模、通用地适配并稳定运行[24] PPIO的实践与产品 - PPIO是一家AI云计算公司,构建了从底层算力到IaaS、PaaS、MaaS的完整AI云能力,为Agent Infra提供底座支撑[26] - 在算力网络层面,公司整合了大量数据中心闲置算力,在中国拥有4000多个算力节点和1300多个合作伙伴,并在2024年将算力网络部署扩展至全球六大洲三十多个地区和国家[28] - 在GPU推理云平台层面,公司于2023年打造了第一代推理云平台,2024年推出分布式推理引擎,托管近百个开源与社区模型,每天处理接近2000亿Token[28] - 公司发布了首个兼容E2B的Agent沙箱,这是一个专为Agent执行任务设计的云端运行环境,以Runtime为核心整合了模型调用、记忆和数据库能力[28][29] - PPIO Agent沙箱基于Firecracker MicroVM构建,具备强安全隔离、毫秒级极速启动(小于200毫秒)、高并发创建(可同时快速启动数千个实例)三大特性[31] - 该沙箱支持动态调用多种工具,旨在为Agent赋予安全可靠、高效敏捷的“手和脚”,并通过安全隔离环境帮助降低错误率,自上线以来月度活跃数持续增长[29][31][32]
Agent 正在终结云计算“流水线”,Infra 必须学会“思考” | 专访无问芯穹夏立雪
AI前线· 2025-12-02 12:28
基础设施范式转变 - 基础设施演进正从AI Infra走向Agent Infra乃至Agentic Infra,成为推动智能体规模化落地的关键力量[2] - 范式从“处理”转变为“思考”,基础设施需从“生产线工厂”转变为“解决方案公司”,为Agent的整体产出质量提供系统性支撑[3] - 基础设施需具备智能性,能够保障Agent执行任务的质量,协调连续且相互关联的多任务协作[3][4] Agent Infra 核心升级维度 - 运行环境需灵活适配Agent的执行方式,环境的沙盒化与灵活调度能力尤为关键[4] - 为Agent配备完善的工具,使其能够有效调用资源[4] - 提供精准而充分的上下文信息,确保任务理解与执行的一致性[4] - 通过安全与监控机制,保障整个任务过程的可控性与可观测性[4] Agentic Infra 的演进与目标 - Agent Infra是第一阶段,旨在让算法能力被更好地发挥,推动智能体走出实验室环境,帮助Agent从演示品走向生产力[9] - Agentic Infra是第二阶段,重点构建能更好支持下一代AI进化与规模化落地的基础设施,推动智能体深度参与基础设施的核心工作流[10] - 目标是实现从“将智能体视为工具”到“将智能体视为协作者”的范式转变,构建支撑智能体高效、稳定、低成本协作与进化的基础设施新形态[10] 当前Agent发展的核心问题与瓶颈 - 模型能力已经相当出色,但配套给Agent的基础设施服务与工具尚不成熟,瓶颈不在模型本身,而在支撑体系的响应能力[5][6] - 用户对“无代码编程”的期待是“用自然语言一步到位生成完整程序”,但现实仍需频繁迭代和更专业知识,高门槛和不确定性导致用户流失[5] - Lovable平台的用户数从6月的峰值3512万跌至9月的不足2000万,下降了超过40%[5] 算力资源优化与调度创新 - 传统AI算力基础设施以固定虚拟化或容器化单元划分资源,在Agent场景下极不经济,造成资源浪费[15] - 良好Agent Infra通过微虚拟化沙箱、沙箱调度和高并发沙箱管理机制,实现毫秒级环境切换和接近100%的资源利用[16] - 容器冷启动过程通常耗时数秒到数十秒,在高频创建和销毁任务的Agent场景中会造成大量时间损耗与资源空转[15] 异构算力统一调度与生态整合 - 核心技术创新是实现资源的统一标准化,包括功能层面打通不同类型算力的使用和效率层面实现任务的合理分配[16] - 国内算力资源种类多样、分布分散,基础设施必须始终面向最前沿,让Agent像使用水电一样使用算力[7][17] - 技术适配是早期最大阻力,一旦把不同模型与不同硬件之间的M × N映射打通,后续维护成本不高[17] 技术先进性与工程落地的协同 - 构建AI原生的基础设施,技术先进性与应用落地性相辅相成、互相迭代[19] - 研发支持弹性伸缩和动态资源调度的沙箱系统,每个Agent的沙箱可以按需启动或销毁,实现毫秒级响应[20] - 资源分配可根据任务类型和负载自动调整,通过智能调度引擎实现高峰弹性扩容、低峰快速收回,显著提升集群资源利用率[20] 未来基础设施形态与发展愿景 - 未来希望看到智能体之间进一步形成组织,共同完成更复杂的任务,各个智能体的KV Cache和上下文可以根据需求实现共享或隔离[14] - 目标是释放无穹算力,让AGI触手可及,通过系统层面的创新,让AGI能够更高效、更可持续地实现[22] - 基础设施引入Agent能力后具备自主性,从而实现更高效的资源整合和更具价值的功能创新[13]
一个好用的Agent Infra,让你闭眼造好智能体
虎嗅· 2025-09-28 11:46
行业趋势 - AI智能体在2024年迎来大爆发 [1] - 企业普遍期望数字员工能创造更多价值 [1] - 大型科技公司纷纷进入AI智能体基础设施领域 [1] 技术焦点 - Agent Infra(智能体基础设施)成为行业关注的核心 [1]
阿里闪电入局Agent Infra!智能体新基建亮相WAIC,“超级大脑”开箱即用
量子位· 2025-07-31 14:51
AI基建与Agent发展 - 大模型时代下AI基建重要性凸显,全球巨头如马斯克19天内组建10万块H100 GPU,扎克伯格计划建设1GW+超算集群 [1] - WAIC 2025显示模型应用成为发展主旋律,基础设施呈现更细化进展 [1] Agent Infra领域动态 - Agent Infra概念被敏锐厂商捕捉,AWS发布Amazon Bedrock AgentCore智能体沙盒并投入1亿美元研发资金 [3] - 阿里云在WAIC推出首款专为AI Agents设计的"无影AgentBay",提供云端沙箱环境支持3行代码快速部署 [3][7] 无影AgentBay核心功能 - 覆盖Linux、Windows、Android等系统层及Browser Use、Code Space等应用层环境,支持移动终端开发 [9] - 支持视觉理解、自然语言控制、任务解析等多模态交互方式,提供原子化工具API和远程串流协议 [11] - 升级跨平台数据漫游系统,实现状态和内存级持久化,减少重复登录操作 [12] - 提供企业级安全沙箱,采用数据加密传输和权限隔离,实现本地环境零侵入 [13] - 基于阿里云算力支持秒级弹性伸缩与千级并发运维能力 [13] Agent落地挑战与解决方案 - 开发环境与算力是Agent落地两大难题,本地设备难以满足高并发、高算力需求 [15] - 无影AgentBay通过云端高性能环境解决硬件限制,自带海量MCP工具并支持可视化操作 [16] - 该方案降低部署门槛,节省运行时间,加速AI Agents规模化进程 [17][18] 行业竞争与市场格局 - 阿里云与AWS在Agent Infra领域同步发力,阿里云产品比AWS早三个月推出 [16][21] - 阿里云2024年下半年稳居中国公有云市场首位,AI收入连续六个季度三位数增长 [22][23] - Agent大规模落地需新基建支持,要求云厂商兼具云技术、AI技术及行业洞察能力 [20][21]
我不给人做产品,给 Agent 做 | 42章经
42章经· 2025-06-29 22:48
Agent Infra市场机会 - Agent Infra被视为下一个投资热点 未来Agent数量将达到SaaS的几千倍[1][2] - 现有互联网基础设施不适合AI使用 需要为Agent重构[2] - Agent Infra市场规模巨大 类比AWS级别的机会[17] - 互联网上40%流量来自机器人 但大模型流量仅占0.1% 未来可能有10万倍增长空间[23][56] Agent与人类差异 - 交互方式:Agent通过文本和多模态后端交互 人类依赖前端界面[5] - 学习方式:Agent可同时执行任务和学习 人类无法并行[5] - 工作模式:Agent多线程并行 人类单线程按流程执行[6][7] - 责任界定:人类可负责自身行为 Agent需要安全边界[8][10] - 执行状态:Agent需保持多任务状态 人类天然不需要[8] Agent浏览器特性 - 云端化运行 持续工作不需休息[24] - 无前端界面 直接后端交互[25] - 设计反馈循环 支持自主迭代[26] - 安全机制:本地处理账号密码 不泄露给大模型[28][29] - 支持多线程任务连续性 避免资源浪费[31] Agent Infra技术架构 - 三层架构:Runtime层(浏览器内核) Agentic层(交互控制) Knowledge层(领域knowhow)[32] - Runtime层解决网页拉取和渲染 Agentic层控制AI与网页交互[33] - 必须同时构建Runtime和Agentic层才能实现完整功能[35] - Browserbase估值3亿美元 专注Runtime层[22][34] Agent Infra细分领域 - 主要环境:Coding环境(逻辑执行) Browser环境(网页交互)[37] - 工具类:身份认证 支付能力 通讯工具等可重做[38] - 场景切入:旅游Agent需CRM 搜索 支付等工具[40] - 数学环境:公式执行器 定理检索等工具[42] - 物理环境:传感器 具身智能 空间智能等[38] 市场发展阶段 - 类比22年AI Coding 当前Browser Use处于早期[44] - 全球软件开发市值3-4万亿美元 AI Coding仅100亿 增长空间大[47] - 互联网活动通过AI提升5%效率将创造巨大市场[48] - 差异化关键:深耕细分场景 抢占99.9%未开发市场[56] Agent产品设计核心 - 反馈循环设计比上下文或数据更重要[50] - 人类知识可能非必要 Agent可通过强化学习自主迭代[51][52] - AlphaProof案例:仅用+1/-1奖励机制 不参考人类解法即获奥数银牌[52] - 未来范式:Agent通过环境体验获取真实反馈 自主进化[53]
活动报名:Agent Infra 领域里的下一个大机会 | 42章经
42章经· 2025-06-15 21:57
Agent Infra赛道机会 - Agent赛道热度持续数月 大量不同方向项目已获融资 行业关注下一波机会方向 [1] - Agent Infra被视为新兴机会领域 包含重构基础设施的潜力 [1] - 硅谷热门项目E2B和Browserbase引发行业关注 代表Agent专用工具的创新方向 [1] 行业活动核心议题 - 活动将探讨从人类产品向Agent产品的转型路径 分析基础设施重构机会点 [2] - 重点讨论Agent专用浏览器的必要性 分享Browser应用实践方法论 [2] - 涉及Agent长期记忆技术解决方案的最新进展 覆盖基础设施层关键技术突破 [2] 行业参与者特征 - 活动聚焦一线创业者实战经验 包括Grasp浏览器创始人等实践者深度分享 [1][2] - 采用50人小型私密交流形式 优先筛选与Agent Infra领域匹配度高的参与者 [2]