Agent模式

搜索文档
AI产业跟踪:openAI发布Agent模式,AIAgent商业化落地与规模化进展有望加速
长江证券· 2025-07-20 19:37
报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 7月18日凌晨OpenAI宣布并介绍即将推出的Agent模式,集成于ChatGPT,已向Pro、Plus和Team计划订阅用户开放,企业版与教育版预计本月底前上线,ChatGPT Agent把“大模型”升级为“大系统”,为后续AI Agent规模化落地提供可借鉴技术路径 [2][5] 根据相关目录分别进行总结 产品侧拆解 - Agent模式本质是能执行复杂、多工具任务的统一AI Agent,由Operator工具和Deep Research工具Agent化封装而来,将四大能力封装进一个端到端Transformer,由同一组参数调度所有工具,减少跨系统延迟和错误传递,可自动利用多种工具规划,帮助用户完成多种复杂任务,还能连接用户Gmail、GitHub获取信息并解决问题,使用API访问各种应用 [12] 性能侧超越 - Agent模式下,HLE测试得分41.6% ,采用学习小组策略时提升至44.4%(o3 no tools得分20.3%),工具增益>纯模型增益;数学FrontierMath得分27.4%,远超o4 - mini(19.3%);网页浏览与信息检索WebArena测试中超越o3驱动的CUA模型,BrowseComp得分68.9%,高于Deep Research 17.4个pct;SpreadsheetBench准确率达45.5%,接近人类水平;DSBench数科测试中大幅超越人类专家 [12] 训练与技术侧拆解 - 技术架构上在沙盒化的虚拟计算机中处理任务,实现推理与执行流畅切换;强化学习方面,ChatGPT智能体能够动态学习并优化工作方式;强调安全性,构建多层安防体系 [12] 能力侧上探 - Agent模式能力核心在于形成的智能Agentic系统构建了完整闭环,已有工具组合的融合把“模型上限”拉升为“系统上限”,使AI在复杂知识工作场景具备更强可商业化的端到端交付能力,或为后续AI Agent规模化落地提供可复制技术范式,有望加速AI Agent商业化落地与规模化推进节奏 [12] 当前投资逻辑 - 视觉推理 + 工具调用深度融合下,“模型即Agent”探索推进,教育、医疗、企服等垂直场景的Agent落地周期有望提前,看好Agent商业化元年及投资机遇,建议关注AI Agent相关厂商、中国推理算力产业链(重点推荐寒武纪)、云服务厂商 [12]
OpenAI 发布 ChatGPT Agent:已向付费用户开放,与 Manus 相似
Founder Park· 2025-07-18 11:19
文章核心观点 - AI 2025年的核心主题是Agent模式,标志着从"动嘴"到"动手"的转变,AI将直接完成复杂任务[1][35] - OpenAI推出的Agent模式整合了Operator和Deep Research工具,实现虚拟机内自主操作浏览器、终端等工具完成实际工作[2][15][18] - 该模式完成复杂任务(如婚礼策划、商品设计下单)仅需10-25分钟,效率显著高于人工[12][13][14] - 使用工具后模型在Humanities Last Exam测试得分提升至42%,接近Grok 4 Heavy的45%[22][23] - Agent时代将重塑人机关系,带来隐私安全、工作替代等社会挑战[33][36][37] Agent模式功能 - 可调用文本浏览器、可视化浏览器和终端三种工具,自主切换完成信息检索、图像处理、代码运行等[6][7] - 演示案例包括:婚礼策划(10分钟生成服装/酒店/礼物全套方案)、宠物周边设计下单(调用Image Gen API)、旅行攻略制作(25分钟生成电子表格+地图)[10][12][13][14] - 支持任务中途插入新需求,允许用户实时交互和手动接管[5] 技术实现路径 - 由Operator(图形界面操作工具)和Deep Research(深度调研工具)融合而成,解决单一工具局限性[15][17] - 通过强化学习训练工具使用策略,初期笨拙尝试所有工具,后期学会最优工具组合(如创意作品先搜索→终端编码→浏览器验证)[20][21] - 在WebArena和SpreadsheetBench测试中接近人类水平,网页操作能力尤其突出[30] 商业化进展 - 开放范围扩大至Plus/Team用户,每月提供40次使用额度,相比此前Pro用户优先策略更具普惠性[3] - 执行效率显著提升:复杂报告生成时间从小时级压缩至10分钟级,预订类任务7分钟可完成[12][17] 行业影响 - 可能催生Agent应用生态,但也对Manus等第三方开发者形成竞争压力[32] - 将重新定义白领工作效率标准,可能加速某些岗位的自动化替代[37] - 需要建立新的安全规范应对虚拟机操作带来的隐私风险(如信用卡信息泄露)[33][34]
刚刚,OpenAI发布了自己的Agent模式,能干什么?
虎嗅APP· 2025-07-18 08:20
OpenAI发布Agent模式 - OpenAI在2025年下半年推出Agent模式,标志着AI从"动嘴"进入"动手"时代,能够直接完成用户指令[3][4] - Agent模式可执行复杂任务如购物、设计、信息整理等,平均耗时10-25分钟,完成度高[4][9][10] - 该模式整合了Operator和Deep Research两款工具,实现浏览器操作与深度研究能力融合[11][12][13] Agent模式技术特点 - 调用三种工具:文本浏览器(信息检索)、可视化浏览器(图形交互)、终端(代码执行/API调用)[8][9] - 采用强化学习训练模型工具选择能力,任务完成效率比纯人工高[14] - 在Humanities Last Exam基准测试中达到42%准确率,较基础模型提升1倍[15][16] 商业化应用进展 - 开放给Plus/Team用户,每月提供40次使用额度,覆盖更广泛用户群体[5] - 演示案例包括婚礼策划(10分钟生成服装/酒店/礼物方案)、贴纸设计下单(7分钟)、旅行攻略制作(25分钟)[9][10] - 网页操作能力接近人类水平(WebArena基准),电子表格处理能力仍有差距[19][20] 行业影响与挑战 - 直接对标Manus模式,可能重塑第三方Agent开发生态格局[7][22] - 引发隐私安全担忧,涉及虚拟环境中的个人信息与支付操作风险[23][24] - 将重新定义人机关系,引发对白领工作岗位替代效应的讨论[25][26]