OpenAI Atlas 深度测评:饼画得很大,但…...|Jinqiu Scan
锦秋集·2025-10-22 22:21

文章核心观点 - ChatGPT Atlas是OpenAI推出的首款桌面浏览器,标志着公司战略从提供底层AI模型延伸至直接控制用户工作流与Web入口[1] - 该产品旨在成为"真正的超级助理",通过将ChatGPT深度融入浏览体验来实现"理解你的世界并帮助你实现目标"的效果[3] - 当前版本在产品成熟度方面存在明显差距,战略雄心与现实能力之间有不小距离,尤其是在基础体验的打磨上仍处于非常早期阶段[4][5][36][37] 三大核心能力测评总结 即时上下文感知(侧边栏对话) - 官方承诺ChatGPT能够伴随用户 anywhere across the web,并理解用户正在查看的内容[9][10] - 学术论文研读场景测试失败,无法成功读取和理解长篇英文学术论文网页内容,PDF文件同样无法直接交互,需要手动上传文件[12][13] - 信息流网站汇总场景中,仅提取五条概括性内容,覆盖面与深度严重不足,暴露信息抓取和关键点提炼的局限性[15][16] - 跨语言邮件润色场景表现出色,能够准确获取选定文本并完美执行翻译润色指令,生成专业商务英文邮件[17][18] - 页面级广域上下文感知能力初级不可靠,而文本级精确上下文感知能力出色,体现为"作用于选区"的工具而非"理解整个页面"的助理[23] 个性化浏览器记忆 - 官方宣称浏览器记忆功能能让ChatGPT记住用户访问网站的上下文,支持基于长期记忆的复杂指令[19][20] - 求职面试准备场景中生成的大纲内容高度同质化,缺乏对浏览过的具体公司和岗位的深度见解,未能体现浏览历史有效利用[22] - 节日礼品挑选场景能识别"美妆护肤品"大类兴趣,但推荐止步于品类层面,无法给出基于浏览记录的具体品牌或产品建议[25][26] - 记忆功能存在明显"颗粒度"问题,仅能进行关键词级别索引分类,缺乏对内容深层语义和用户潜在意图的理解推理能力[27] - 用户可随时开关记忆、按站点控制权限、清除历史记录,体现设计上的审慎态度[28] 自主智能体模式(Agent Mode) - 该模式面向ChatGPT Plus、Pro和Business订阅用户,旨在将浏览器从被动工具转变为能自主执行多步骤任务的智能助手[29] - 官方描述其强大能力可完成"计划晚宴找到杂货店添加所有食材到购物车并配送到家"等复杂任务[30] - 工作流程包括意图输入、规划与确认、自主执行、用户监督与控制四个标准化步骤[32] - 代表浏览器未来演进方向,即将浏览器从信息呈现工具转变为任务执行平台,是构建核心竞争壁垒的关键[33] - 成功需要三个核心前提:精确的环境感知、深刻的意图理解、稳健的任务规划与执行,但基于前两部分测试,当前实用性存疑[34][39] - 目前更像建立在尚不稳固地基上的宏伟蓝图,成功取决于未来版本对基础感知和理解能力的迭代速度[35]