Workflow
AI Agent
icon
搜索文档
ChatGPT Agent从工具到抢饭碗,资本押注哪些赛道?
21世纪经济报道· 2025-07-20 22:29
ChatGPT Agent技术突破 - 实现"感知-决策-行动"闭环,能完成数据采集、深度分析、内容生成全流程任务,例如自动制作新能源汽车市场趋势PPT时抓取行业报告、生成财务预测图表并排版[1] - 在"人类终极考试"中单次通过率达41.6%,DS Bench数据分析测试得分89.9%,显著优于人类水平[2] - 金融领域处理杠杆收购模型效率较人工提升8倍,工业Agent使设备维护成本降低22%[2] 行业应用与商业化进展 - 企业级智能体落地优先级排序:企业服务(OA/ERP/CRM)、金融/财务/风控、营销/电商、制造/供应链、法律/政务、医疗/教育[2] - 企业服务领域ROI明确性、数据基础、标准化程度均为五星级,商业化进度四星;医疗/教育领域各项指标均低于三星[3] - 产业从"过程交付"转向"结果交付",软件服务计价方式从流程收费转为业务成果导向[2] 投资标的与技术亮点 - **技术层**:科大讯飞中文语音识别率98.6%,覆盖3.2万所学校;拓尔思金融舆情分析准确率92%,研报效率提升5倍;云从科技智慧城市事件响应提速40%[5] - **应用层**:鼎捷智能集成300+机理模型良率提升3-5%;汉得信息智能审批Agent提升抖音电商ROI 40%;卫宁健康医疗影像识别准确率97.8%[5] - **算力层**:中科曙光液冷服务器PUE<1.1,国产化率超90%;寒武纪芯片算力密度提升300%[5] 产业变革方向 - 重新定义人机协同边界,Agent可自主完成80%标准化工作,人类价值转向20%创造性工作[4] - "算力-协议-应用"传导链条被视为未来2-3年核心投资主线[3] 配套产业链动态 - 高频高速PCB铜箔需求激增,铜冠铜箔HVLP3铜箔进入英伟达H200供应链,适配112Gbps高速传输[7] - 全球高端PCB产值同比增速预测达40%,铜冠铜箔高频高速铜箔市占率内资前二[7]
策略周报:科技突围:“反内卷”预期或阶段性升温,成长弹性仍具中线配置价值,重视国产算力-20250720
中银国际· 2025-07-20 19:42
报告核心观点 - “反内卷”预期或阶段性升温,成长弹性仍具中线配置价值,重视国产算力、机器人、创新药等主线机会 [1] 观点回顾 - 20241215报告认为重要会议定调下,新兴消费与“AI + 应用”作为跨年主线的线索明确 [9] - 20241216报告表示盈利弱复苏,估值强支撑,科技和高端制造业有望成为市场主导 [9] - 20250209报告指出A股性价比优势凸显,DeepSeek产业驱动下,AI Infra有望率先反应 [9] - 20250216报告称DeepSeek高性价比凸显之下,云计算正在成为大模型时代的“卖水人”,应用端重点关注医疗、企服、教育、办公、金融、营销等垂直领域 [9] 大势与风格 - 本周二季度国内经济数据及重要会议预期落地,市场持续震荡上行,6月投资消费走弱但社融显著放量,企业中长贷或提振内需,中央城市工作会议召开使地产政策预期阶段性兑现,月末政治局会议临近,“反内卷”行情或阶段性升温 [2][10] - 7月以来美元底部反弹、金价上行趋缓,超预期的6月零售及就业数据强化美联储“维持高利率”立场,往后美元面临较大不确定性,需警惕特朗普政策落地超预期对资产价格的潜在冲击 [2][11] 中观行业与景气 - 本周通信、医药、机械行业涨幅居前,分别得益于通信行业龙头公司中报业绩预告向好、第十一批国家组织药品集中采购工作启动、智元机器人和宇树科技中标代工服务采购项目 [30] - 人形机器人行业迎密集催化,政策上工信部推动其发展,股权融资层面宇树科技开启上市辅导,其上市将成产业迈向成熟标志,加速行业资源整合,吸引长期资金关注硬科技赛道 [31][32] - H20芯片破局,算力产业链再迎催化,国产算力性能提升,H20对其冲击有限仍具行情催化动力,OpenAI发布ChatGPT Agent加速催化算力需求,建议关注服务器等细分赛道及AI Agent赛道 [2][36][38] - 商业健康保险创新药目录调整打开支付空间,创新药行业再迎政策催化,出海进程加速,价值正在重估,后续行情可期 [2][40] 一周市场总览、组合表现及热点追踪 - 本周A股市场主力资金净卖出335.14亿元,环比由净买入转净卖出,汽车、医药生物、通信行业资金净流入规模居前,非银金融、传媒和公用事业资金净流出规模最大 [43] - 本周股票型ETF场内净申购金额为10.81亿元,环比回落,份额增加最多的ETF集中在券商、科技板块,减少最多的集中在核心指数领域 [43] - 财政部、税务总局下调超豪华小汽车征收价格阈值至90万元,新政或搅动豪车市场格局,新能源车型有望获竞争优势,二手豪车交易量有望快速增长 [2][47][48]
AI产业跟踪:openAI发布Agent模式,AIAgent商业化落地与规模化进展有望加速
长江证券· 2025-07-20 19:37
报告行业投资评级 - 看好丨维持 [8] 报告的核心观点 - 7月18日凌晨OpenAI宣布并介绍即将推出的Agent模式,集成于ChatGPT,已向Pro、Plus和Team计划订阅用户开放,企业版与教育版预计本月底前上线,ChatGPT Agent把“大模型”升级为“大系统”,为后续AI Agent规模化落地提供可借鉴技术路径 [2][5] 根据相关目录分别进行总结 产品侧拆解 - Agent模式本质是能执行复杂、多工具任务的统一AI Agent,由Operator工具和Deep Research工具Agent化封装而来,将四大能力封装进一个端到端Transformer,由同一组参数调度所有工具,减少跨系统延迟和错误传递,可自动利用多种工具规划,帮助用户完成多种复杂任务,还能连接用户Gmail、GitHub获取信息并解决问题,使用API访问各种应用 [12] 性能侧超越 - Agent模式下,HLE测试得分41.6% ,采用学习小组策略时提升至44.4%(o3 no tools得分20.3%),工具增益>纯模型增益;数学FrontierMath得分27.4%,远超o4 - mini(19.3%);网页浏览与信息检索WebArena测试中超越o3驱动的CUA模型,BrowseComp得分68.9%,高于Deep Research 17.4个pct;SpreadsheetBench准确率达45.5%,接近人类水平;DSBench数科测试中大幅超越人类专家 [12] 训练与技术侧拆解 - 技术架构上在沙盒化的虚拟计算机中处理任务,实现推理与执行流畅切换;强化学习方面,ChatGPT智能体能够动态学习并优化工作方式;强调安全性,构建多层安防体系 [12] 能力侧上探 - Agent模式能力核心在于形成的智能Agentic系统构建了完整闭环,已有工具组合的融合把“模型上限”拉升为“系统上限”,使AI在复杂知识工作场景具备更强可商业化的端到端交付能力,或为后续AI Agent规模化落地提供可复制技术范式,有望加速AI Agent商业化落地与规模化推进节奏 [12] 当前投资逻辑 - 视觉推理 + 工具调用深度融合下,“模型即Agent”探索推进,教育、医疗、企服等垂直场景的Agent落地周期有望提前,看好Agent商业化元年及投资机遇,建议关注AI Agent相关厂商、中国推理算力产业链(重点推荐寒武纪)、云服务厂商 [12]
OpenAI会杀死Manus们吗?
虎嗅APP· 2025-07-20 11:02
OpenAI推出ChatGPT Agent - OpenAI发布ChatGPT Agent,可自动规划执行步骤并调用多种工具完成复杂任务[3][7] - 该模型被归入o3系列,在单一系统中完成规划、工具调用和文档生成等流程[7][8] - 创始人山姆·阿尔特曼称这是首次"真正感受到AGI",研究人员认为这是目前最强AI Agent模型[7] 创业公司反应 - Manus在发布会后3小时内发布10条对比测试,宣称在响应速度和任务完成度上全面占优[10][11][18] - Genspark创始人表示其24人团队产品响应时间更短、成本更低,生成质量"高出好几倍"[19] - 创业公司通过工程迭代和提示优化提升输出质量和交付体验,如Manus加入PPT、视频生成等能力[24] 技术路线差异 - OpenAI采用端到端训练的统一模型,在学术测试中表现优异[24][25] - ChatGPT Agent在《人类的最后考试》评估中取得41.6%成绩,是o3的两倍[25] - Manus坚持上下文工程技术路线,通过KV缓存设计降低首个token生成时间和推理成本[26][27][29] 市场影响与趋势 - 全球AI Agent市场规模预计从2024年51亿美元增长至2030年471亿美元,CAGR达44.8%[38] - 微软CEO表示20%-30%代码由AI生成,Klarna的AI Agent处理了2/3客服工作相当于700名人工[38] - Deloitte预测到2025年25%使用生成式AI的公司将试点智能体,2027年增至50%[38] 产品特性对比 - ChatGPT Agent生成内容较粗糙,如简单行程表,而Manus输出带设计的行程海报[11][18] - 在财务报告分析中,OpenAI输出Excel文件,Manus提供含图表和总结的完整演示文档[18] - OpenAI研究员承认生成速度较慢,复杂任务需20分钟以上,但强调相比手动仍是显著提速[20] 未来发展 - OpenAI计划定期更新更多功能,表示本次发布仅是集成智能体功能的第一步[22] - 公司正在开发支付结账系统,可能向通过ChatGPT完成订单的商家收取佣金[41] - 行业面临隐私和安全挑战,AI Agent可访问日历、邮件等敏感信息[39][40]
Manus季逸超:构建Manus的经验教训 | Jinqiu Select
锦秋集· 2025-07-19 13:00
通用型AI Agent技术路线 - 业界形成两条技术路线:端到端训练和上下文工程 模型厂商倾向端到端训练以发挥自有闭源模型优势 而通用Agent创业公司多选择上下文工程路径[1] - Manus团队作为上下文工程代表 其技术负责人季逸超因GPT-3导致自研模型失效经历 选择成为"涨潮中的船"而非"固定支柱"的技术哲学[4] - 上下文工程通过四次系统重构和服务数百万用户验证 将产品迭代周期从数周缩短至数小时[2][5] KV-Cache优化实践 - KV-cache命中率是生产阶段AI代理最关键指标 直接影响延迟和成本 Claude Sonnet缓存/未缓存token成本相差10倍(0.3 vs 3美元/MTok)[7] - 优化方法包括:保持提示前缀稳定 使用仅追加上下文 确保序列化确定性 手动标记缓存断点 分布式节点路由技术[9][10][11] - Manus平均输入与输出token比率达100:1 通过缓存优化实现10倍成本降低[7] 工具管理策略 - 动态修改工具定义会导致KV-cache失效和模型混淆 Manus采用token logits屏蔽技术替代动态修改[12][13] - 设计工具命名一致性(如browser_/shell_前缀) 结合三种函数调用模式(Auto/Required/Specified)实现上下文感知约束[16] 上下文扩展技术 - 突破128K token限制:将文件系统作为外部化内存 保留可恢复压缩策略(如仅存URL) 实现无限上下文存储[18][22] - 创建并持续更新todo.md文件 通过自然语言复述将任务目标保持在模型注意力焦点 解决50次工具调用中的目标偏离问题[23][26] 错误处理与多样性 - 保留错误内容可让模型从失败动作中学习 错误恢复能力是真实代理行为的关键指标[27][30] - 避免few-shot陷阱 通过引入动作/观察的结构化变化打破重复模式 防止模型陷入固定行为路径[31][32][33] 行业发展趋势 - 上下文工程成为代理系统必备能力 模型进步需结合内存/环境/反馈设计 未来代理将基于上下文迭代构建[35] - 创业团队通过轻量级技术路径验证 锦秋基金关注AI Agent赛道早期创新项目[3][36]
ChatGPT Agent遭暴击,国产AI轮番“公开处刑”
虎嗅· 2025-07-19 12:00
Agent市场竞争格局 - OpenAI推出ChatGPT agent引发竞品密集对比测试 Manus、Genspark等公司通过社交媒体展示产品优势 [1][4][5] - ChatGPT agent面向Pro用户开放 需求超预期导致Plus/Team用户访问延迟至下周 [6] - 竞品反应激烈 Manus发布10条对比推文 Minimax生成多格式报告 Kimi采用深度调研模式 [110][147][153] 产品功能实测表现 - **任务完成效率**:ChatGPT agent用20分钟生成14页退休计划PPT Manus耗时10分钟 Minimax需1小时 [12][51][111] - **输出质量差异**: - ChatGPT agent生成黑白简易PPT 未优化可视化效果 [14][175] - Manus提供彩色排版 但未标注信息来源 [54][56] - Minimax同时输出PPT/PDF/在线链接 含详细数据可视化 [113][147] - Kimi报告超50页 含用户个性化提问及引用标注 [151][153] - **核心能力对比**: - ChatGPT agent整合Deep Research+Operator+ChatGPT 但缺乏前端优化 [174] - Kimi实现"观察-思考-纠错"闭环 更接近真实秘书体验 [150] 行业技术演进方向 - 产品形态从问答机器人转向协作型AI工具 支持复杂任务执行 [176] - 交互范式从chat-first进化为artifact-first 强调任务成果交付 [149] - 技术焦点转向人机交互主入口争夺 大模型公司扩展应用层布局 [177] 典型应用场景案例 - **退休规划**:年收入50万美元目标30岁退休 需82%储蓄率+7%年化回报 实际测算显示5年仅积累250万加元 [28][159][161] - **税务优化**:加拿大RRSP账户年供款上限31,560加元 TFSA账户7,000加元 高收入者边际税率达53.5% [168][169] - **成本控制**:温哥华月生活成本4,409加元 极端储蓄需压缩至2,500加元租房预算 [65][163] 竞品差异化策略 - Manus强调执行落地能力 在电商/金融分析等场景提供完整项目交付 [105][109] - Minimax侧重严谨性 包含风险管理和税务优化策略 [132][134] - Kimi深度调研模式覆盖资产配置/提款率分析等细节 数据量远超同行 [153][170]
烧钱换能力,老员工经验作废!一线Agent厂商、用户经验亲述:抛弃技术驱动,巨额投入如何不打水漂?
AI前线· 2025-07-19 11:44
AI Agent市场现状 - 2024年中国AI Agent软件市场规模突破50亿元[1] - 51%受访者已在生产环境中使用Agent 中型公司(100-2000人)采用积极性最高[1] - 非科技公司中90%受访者已或计划将Agent投入生产 性能质量和成本是主要关注点[1] 企业应用策略 - 来也科技从RPA+AI转向基于大模型的数字化劳动力平台 2023年推出三款智能体助手产品[4] - 英科医疗年初开始应用多种大模型 与来也科技合作营销/HR领域 与飞书合作终端用户应用[5] - 制造业生产环节应用挑战较大 当前落地主要在销售和职能管理方向[6] 产品定位差异 - 传统自动化侧重后台降本增效 AI Agent更多支持前台业务增长和扩张[7] - 英科医疗现阶段更看重模式创新而非降本增效 认为后者是必然结果[7][8] - RPA应用从最初几个流程发展到近1000个 体现量变到质变过程[9] 组织文化转型 - 英科医疗董事长亲自推动AI转型 举办创新大赛并设立多重奖励机制[10] - 招聘策略转向顶尖高校和社会人员潜力 降低经验权重[12] - 研发团队年轻化是关键 80后/70后需保持思维活跃以适应新技术[13] 技术架构演进 - 来也科技重构产品架构 将RPA作为UI自动化工具 IDP作为文档处理工具[19] - 工作流与智能体结合的复合编排方式更为实用 核心流程仍需依赖工作流[23] - 大模型能力不足和业务结果获取难度是当前主要瓶颈[26][27] 成本与研发策略 - 创新阶段不过度关注成本 英科医疗视其为员工能力投资[31] - 来也科技采用精锐小团队模式(3-8人)开发新智能体应用 避免资源浪费[33] - 营销类智能体效果衡量标准是有效线索和交易促成 已观察到积极反馈[35] 未来发展机遇 - C端机会在于软硬件结合的新终端设备 B端几乎所有流程都需要Agent迭代[37][38] - 企业存活关键是找到精准定位 制造业需围绕公司战略方向部署Agent[39] - 来也科技退出欧洲市场后聚焦东南亚/港澳台地区 保持大客户策略[40][41]
大厂入局“围猎”AI Agent,谁能先闯出路?
第一财经· 2025-07-18 22:32
行业动态 - 2025年Agent赛道迎来头部大厂入场,OpenAI发布ChatGPT Agent产品,融合Operator远程可视化浏览器环境执行任务能力、DeepResearch多步研究整合能力及ChatGPT对话能力 [1] - OpenAI为开发ChatGPT Agent合并Operator与Deep Research团队,组成20到35人统一团队 [1] - 亚马逊云科技发布Bedrock AgentCore服务,提供核心组件帮助企业构建AI Agent,其AGI实验室开发的Nova Act已能自主完成购物等复杂任务 [1] - 中国一级市场受朱啸虎言论影响,认为大模型将淘汰90%的Agent创业者,类比互联网早期个人站长面临淘汰 [2] 产品与技术 - ChatGPT Agent采用OpenAI o3同系列专用模型,端到端训练,区别于其他产品的多模型工程化组合 [6] - 行业已有Manus、Lovart等明星产品,但面临同质化、速度慢、技术缺乏代际差质疑 [6] - OpenAI计划开发电子商务功能,测试集成结账系统并通过销售分成获取营收,可能抽取约2%交易费用 [7] - 亚马逊向生成式AI技术创新中心追加1亿美元投资,与Meta合作支持初创企业利用Llama模型 [7] 市场竞争 - GPT Plus套餐每月20美元,Manus基础计划每月19美元,创业公司未显价格优势 [6] - 通用类Agent进入成熟期,大厂如OpenAI、字节跳动Coze空间主导赛道,垂类行业具备交付能力的创业公司仍有机会 [6] - Agent竞争趋向平台化,OpenAI从流量入口切入,亚马逊提供全栈支持 [8] 行业趋势 - Gartner预测到2027年底40%的Agentic AI项目将被取消,因成本高、商业价值有限及风险控制不足 [11] - 当前仅19%公司对Agentic AI进行大量投资,42%投资保守,超30%持观望态度 [12] - 行业面临"智能体包装"现象,供应商将RPA等重新包装为Agent产品 [12] - 专用模型迭代将超越多模型拼凑方案,成为技术核心门槛 [13] - 未来三至五年行业将从"概念炒作"进入"实用主义"阶段 [13]
AI日报丨将暴跌76%!汇丰唱衰CoreWeave:过度依赖微软与英伟达
美股研究社· 2025-07-18 20:55
AI快报 - OpenAI发布ChatGPT Agent 具备自主思考和行动能力 能主动选择工具完成复杂任务 [3] - AI搜索引擎初创公司Perplexity估值突破180亿美元 5月中旬按140亿美元估值融资5亿美元 [4] - 新思科技完成350亿美元收购Ansys 创今年最大并购案 整合芯片设计和仿真技术打造AI驱动解决方案 [5] - 汇丰予CoreWeave"减持"评级 目标价32美元(较收盘价低76%) 主因回报低、缺乏差异化优势及过度依赖微软和英伟达 [5] 机构看AI - 中金看好AI Agent产业浪潮 预计2025年实现多行业规模化落地 构建完整商业闭环 [8] 七巨头日报 - 亚马逊AWS云部门裁员 未透露具体人数 称系业务优先级调整 非AI驱动 [10][11][12] - 亚马逊强调继续在核心业务招聘 裁员部门将获60天工资福利及遣散费 [13][14][16] - 公司表示遵循各国当地法规流程 包括咨询流程 [17]
Open AI再放大招
格隆汇APP· 2025-07-18 18:16
OpenAI ChatGPT智能体系 - ChatGPT智能体系融合Operator远程浏览器执行能力、Deep Research网络信息整合技术及ChatGPT对话优势,成为统一智能体平台的集大成者[1] - 该系统具备自主思考和行动能力,能从技能库主动挑选工具完成超复杂任务,通过"内置计算机"执行多步骤任务,突破传统问答局限[1] - 实际应用表现包括:10分钟内完成结婚请柬相关男装、鞋子推荐及礼物建议 规划全美30座棒球队观赛路线并推荐酒店 快速整理日历信息汇报客户会议[1] - 技术架构采用虚拟计算机处理任务,在推理与执行间灵活切换,集成多工具并配备多种网络工具[1] - 安全机制包括敏感操作前征求用户授权、主动监督和风险缓解功能,拒绝高风险任务[1] AI Agent技术竞争格局 - 2025年上半年AI Agent模型竞争进入白热化阶段[1] - DeepSeek通过强化学习创新打破OpenAI在推理模型赛道的垄断,缩小国内外技术差距[2] - OpenAI推出o3 Pro、Anthropic发布Claude 4系列、Google推出Gemini 2.5 Pro,头部厂商迭代速度超预期[2] - Meta宣布投资150亿美元给数据标签公司Scale AI并重组AI部门[3] - 国内阿里发布通义千问3.0、字节推出豆包1.6版本,DeepSeek的R1模型通过强化学习显著提升推理能力[3] AI Agent应用场景 - 编程领域:AI coding工具可通过自然语言自动生成代码框架、查找漏洞、重构代码 ChatGPT Agent的多工具协作能力将带来更高效体验[4] - 设计领域:专业设计智能体Lovart实现从需求理解到品牌视觉方案交付的全流程自动化,支持2D图像、矢量图形、3D模型等创作[4] - 音视频创作:万兴超媒Agent整合资源与工具推动创作流程智能化 ChatGPT Agent的信息整合能力有望带来新变革[4] - 日常生活:可智能浏览网页、筛选结果、运行代码、分析数据、生成PPT和Excel 策划婚礼时自主推荐礼服、预订酒店、准备礼物[5] AI Agent技术演进方向 - 自主决策与环境感知能力增强,能像人类一样根据环境和任务需求分析决策 如自动驾驶领域实时感知路况并做出驾驶决策[5] - 工具使用与协作能力持续提升,可与Gmail、Github等外部工具交互 处理复杂任务时协同使用文本浏览器、可视化浏览器、终端等多种工具[5] - 多Agent协作成为研究热点,未来有望像人类团队一样分工解决复杂问题 ChatGPT Agent的多工具集成体现强大协作力[6] 市场规模与商业模式 - 预计2030年全球AI Agent市场规模达471亿美元,复合年增长率44.8%[7] - 当前商业模式以订阅与token付费并存 ChatGPT Agent为Pro用户提供每月400次额度,Plus和Team用户40次[8] - 垂类AI Agent依托行业知识在编程、设计等场景优先落地,探索ToC硬件和长链条规划创新[8]