Workflow
一文读懂GPT-5发布会:新功能乏善可陈
虎嗅·2025-08-08 08:56

ChatGPT Agent发布 - 公司正式发布ChatGPT Agent,一款通用型AI Agent,具有自主任务执行能力[2][4] - 该产品整合了Operator和Deep Research团队的能力,团队规模20至35人[7][16] - 采用端到端训练方法,是统一模型而非多个模型组合[8][20] 技术路径与功能 - 独特技术路径:Agent能力内化于模型,不同于Manus的"外部缝合"方式[5][6] - 配备四种工具:可视化浏览器、文本浏览器、终端和API访问[19][21] - 可在虚拟计算机环境中保存任务上下文,支持用户打断和继续[18] 性能表现 - 在HLE基准测试达到41.6%,高于Grok4的41.0%[26][27] - FrontierMath数学基准准确率27.4%[29] - 现实数据科学任务DSBench准确率89.9%和85.5%[33] - 电子表格编辑能力45.5%,超过Copilot in Excel的20%[36] 产品可用性与定价 - 立即向Pro用户开放,Plus与Team用户数日内开通[42] - Pro用户每月400条消息,其他付费用户40条[43] - 定价每月20美元,与Manus的19美元接近[15] 竞争格局 - 首次集成完整虚拟机环境,用户可实时观察AI操作[51] - 与Claude对比:ChatGPT Agent强调自主代理,Claude侧重工具使用[54] - 公司承认功能仍处早期,将持续迭代优化[53] 行业影响 - 发布标志着"Agent即模型"趋势加速[1][51] - 产品演示引发对AGI进展的讨论[54][55] - 用户对GPT-5的期待仍在持续[55][56]