OpenAI的Agent来了，被批“鸡肋”升级？

产品发布 - OpenAI于7月18日发布ChatGPT Agent，整合Operator的视觉交互能力和DeepResearch的信息合成能力，旨在打造全能助理[1][2] - 新产品覆盖办公自动化、生活助手、深度研究等多场景，可自动生成会议简报、竞品分析PPT、规划菜单并采购等[3] - 功能目前仅向Pro、Plus和Team用户开放，且Plus与Team用户每月限用40次[5] 技术性能 - 在HLE测试中pass@1得分达41.6%，刷新纪录；SpreadsheetBench测试准确率45.54%，远超微软Copilot in Excel的20%[3] - 内部测试显示其50%知识工作任务表现比肩或超越人类，但用户反馈实际任务完成率同样约50%[4] - 采用虚拟机同时调度视觉浏览器、文本浏览器和代码终端，解决Operator与DeepResearch的原有短板[2] 用户体验争议 - 效率问题突出：15秒手动任务Agent耗时35分钟，且结果需额外2-3倍时间核对[4] - PPT生成功能美观度不足，被评逊色于竞品；服务器崩溃问题仍存[4][5] - 连接Google Drive等私密数据源引发安全担忧，99.99%成功率仍意味美国每周潜在7200次错误[4] 行业趋势 - AI竞赛进入下半场，从技术突破转向精细化运营，聚焦实际应用与商业化[5] - 公司采取实时监控、禁用记忆功能等措施应对生物化学武器领域的高风险能力[6] - 行业面临核心矛盾：强大能力与高昂成本间的可持续商业模式探索[5] 产品定位 - 此次更新属内部整合型常规升级，非颠覆性创新，反映巨头产品迭代策略转变[1][5] - 发布本质为大规模公开测试，非成熟商业产品，凸显能力与实用性的现存鸿沟[5][6]