OpenAI Atlas 深度测评：饼画得很大，但…...｜Jinqiu Scan

文章核心观点 - ChatGPT Atlas是OpenAI推出的首款桌面浏览器，标志着公司战略从提供底层AI模型延伸至直接控制用户工作流与Web入口[1] - 该产品旨在成为"真正的超级助理"，通过将ChatGPT深度融入浏览体验来实现"理解你的世界并帮助你实现目标"的效果[3] - 当前版本在产品成熟度方面存在明显差距，战略雄心与现实能力之间有不小距离，尤其是在基础体验的打磨上仍处于非常早期阶段[4][5][36][37] 三大核心能力测评总结即时上下文感知（侧边栏对话） - 官方承诺ChatGPT能够伴随用户 anywhere across the web，并理解用户正在查看的内容[9][10] - 学术论文研读场景测试失败，无法成功读取和理解长篇英文学术论文网页内容，PDF文件同样无法直接交互，需要手动上传文件[12][13] - 信息流网站汇总场景中，仅提取五条概括性内容，覆盖面与深度严重不足，暴露信息抓取和关键点提炼的局限性[15][16] - 跨语言邮件润色场景表现出色，能够准确获取选定文本并完美执行翻译润色指令，生成专业商务英文邮件[17][18] - 页面级广域上下文感知能力初级不可靠，而文本级精确上下文感知能力出色，体现为"作用于选区"的工具而非"理解整个页面"的助理[23] 个性化浏览器记忆 - 官方宣称浏览器记忆功能能让ChatGPT记住用户访问网站的上下文，支持基于长期记忆的复杂指令[19][20] - 求职面试准备场景中生成的大纲内容高度同质化，缺乏对浏览过的具体公司和岗位的深度见解，未能体现浏览历史有效利用[22] - 节日礼品挑选场景能识别"美妆护肤品"大类兴趣，但推荐止步于品类层面，无法给出基于浏览记录的具体品牌或产品建议[25][26] - 记忆功能存在明显"颗粒度"问题，仅能进行关键词级别索引分类，缺乏对内容深层语义和用户潜在意图的理解推理能力[27] - 用户可随时开关记忆、按站点控制权限、清除历史记录，体现设计上的审慎态度[28] 自主智能体模式（Agent Mode） - 该模式面向ChatGPT Plus、Pro和Business订阅用户，旨在将浏览器从被动工具转变为能自主执行多步骤任务的智能助手[29] - 官方描述其强大能力可完成"计划晚宴找到杂货店添加所有食材到购物车并配送到家"等复杂任务[30] - 工作流程包括意图输入、规划与确认、自主执行、用户监督与控制四个标准化步骤[32] - 代表浏览器未来演进方向，即将浏览器从信息呈现工具转变为任务执行平台，是构建核心竞争壁垒的关键[33] - 成功需要三个核心前提：精确的环境感知、深刻的意图理解、稳健的任务规划与执行，但基于前两部分测试，当前实用性存疑[34][39] - 目前更像建立在尚不稳固地基上的宏伟蓝图，成功取决于未来版本对基础感知和理解能力的迭代速度[35]