Workflow
OWL架构
icon
搜索文档
「套壳」的最高境界:OpenAI揭秘Atlas浏览器架构OWL
机器之心· 2025-10-31 11:01
文章核心观点 - OpenAI发布的新浏览器Atlas虽然基于Chromium,但通过其创新的OWL架构实现了根本性的重构,将Chromium引擎与主应用进程分离,从而提升了性能、开发效率和用户体验,并非简单的“套壳”浏览器 [1][10][12] OWL架构的设计理念与优势 - OWL架构的核心理念是将Chromium浏览器进程独立于Atlas主应用进程之外运行,通过Mojo进程间通信系统进行连接 [11][12][17] - 该设计带来多重优势:应用几乎实现秒级启动、Chromium问题不会导致主应用崩溃、极大减少了与上游Chromium代码的合并冲突、使大多数工程师无需本地编译Chromium,构建时间缩短至几分钟 [7][15][18] - 公司强调其工程文化是“第一天就能上线代码”,新工程师入职当天下午即需提交代码,OWL架构保障了这一传统得以延续 [10] 技术实现细节 - 用户界面几乎从零重建,使用最现代的原生框架如SwiftUI、AppKit和Metal,而非简单为开源Chromium界面“换皮” [8][9][10] - 渲染机制通过跨进程传递像素实现,WebView在客户端应用中共享合成容器,不同标签页内容动态交换显示 [23][24] - 输入事件处理由Swift客户端完成转译后再发送给Chromium,如果网页未处理事件,系统会重新生成NSEvent让Atlas其他部分接管 [30][31][34] Agent模式的特殊处理 - 智能体浏览模式对渲染、输入和数据存储有特殊要求,需要屏幕完整图像作为输入,因此会将如下拉框等独立弹窗重新合成为主页面的一部分 [35][36] - 输入事件遵循安全原则,Agent生成的事件直接传递给渲染器,不经过特权浏览器层,以确保沙箱隔离 [36] - Agent会话可在临时“登出”上下文中运行,借助Chromium的StoragePartition创建独立内存存储,会话结束后所有Cookie和数据均被清除,用户可同时运行多个互不干扰的会话 [37]