产品发布 - OpenAI于7月18日发布ChatGPT Agent,整合Operator的视觉交互能力和DeepResearch的信息合成能力,旨在打造全能助理[1][2] - 新产品覆盖办公自动化、生活助手、深度研究等多场景,可自动生成会议简报、竞品分析PPT、规划菜单并采购等[3] - 功能目前仅向Pro、Plus和Team用户开放,且Plus与Team用户每月限用40次[5] 技术性能 - 在HLE测试中pass@1得分达41.6%,刷新纪录;SpreadsheetBench测试准确率45.54%,远超微软Copilot in Excel的20%[3] - 内部测试显示其50%知识工作任务表现比肩或超越人类,但用户反馈实际任务完成率同样约50%[4] - 采用虚拟机同时调度视觉浏览器、文本浏览器和代码终端,解决Operator与DeepResearch的原有短板[2] 用户体验争议 - 效率问题突出:15秒手动任务Agent耗时35分钟,且结果需额外2-3倍时间核对[4] - PPT生成功能美观度不足,被评逊色于竞品;服务器崩溃问题仍存[4][5] - 连接Google Drive等私密数据源引发安全担忧,99.99%成功率仍意味美国每周潜在7200次错误[4] 行业趋势 - AI竞赛进入下半场,从技术突破转向精细化运营,聚焦实际应用与商业化[5] - 公司采取实时监控、禁用记忆功能等措施应对生物化学武器领域的高风险能力[6] - 行业面临核心矛盾:强大能力与高昂成本间的可持续商业模式探索[5] 产品定位 - 此次更新属内部整合型常规升级,非颠覆性创新,反映巨头产品迭代策略转变[1][5] - 发布本质为大规模公开测试,非成熟商业产品,凸显能力与实用性的现存鸿沟[5][6]
OpenAI的Agent来了,被批“鸡肋”升级?
21世纪经济报道·2025-07-18 19:26