Workflow
OpenAI 深夜发布 ChatGPT Agent:对标Manus、硬刚 Grok 4
AI科技大本营·2025-07-18 18:23

ChatGPT Agent发布 - OpenAI发布ChatGPT Agent 整合"Operator"网络搜索智能体与"Deep Research"深度研究智能体 解决上一代产品功能局限 [2] - 配备图形化浏览器 文本浏览器 命令行终端及API调用等多种工具 可接入用户邮件和GitHub账户 [2] - 支持用户在智能体内置浏览器完成登录 授权执行更深入研究与任务 [2] 运行机制 - 调用虚拟计算机运行代码或搜索信息 用户可随时终止或接管任务 [3] - 可无缝继续之前工作 必要时向用户请求进一步澄清 [3] - 展示功能与Manus高度相似 包括调用虚拟计算机解压阅读简历 中断任务等 [3][4] 性能表现 - HLE基准测试得分44.4% 与Grok 4持平 [5] - FrontierMath数学测试成绩高出o4 mini 8% 比Grok 4高出15% [5] - DSBench测试数据分析优势25% 数据建模优势20% [6] - 电子表格测试正确率45% 低于人类71%水平 [6] 金融领域应用 - 完成71.3%投行入门级任务 如建立三报表财务模型 表现优于o3和DeepResearch [7] - Anthropic同日宣布金融智能体计划 预示金融投资成为AI公司竞争焦点 [7][8] - OpenAI与Anthropic将目光投向金融行业 揭示智能体竞赛新方向 [8] 行业动态 - 亚马逊发布Kiro智能体编程软件 [8] - 马斯克为Grok增加"同伴模式"深化人机交流 [8] - Manus探索日常任务自动化 [8]