AgentOS

搜索文档
微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」
机器之心· 2025-05-06 16:04
微软UFO² AgentOS技术突破 - 业内首个深度集成Windows操作系统的桌面智能体平台,以"AgentOS"理念设计,解决传统智能体界面交互脆弱和执行中断问题 [3][6] - 多智能体架构包含HostAgent负责任务解析与分解,AppAgent提供定制化API接入和界面感知能力,支持跨应用任务 [6] - 统一GUI-API混合执行模式通过Puppeteer接口动态选择最优方案,平衡效率与通用性 [7] - 混合控件感知结合Windows UIA接口与OmniParser-v2视觉模型,提升复杂界面下的识别准确率至90%以上 [10] - 推测式多步执行技术减少51.5%的LLM调用次数,显著降低延迟和计算成本 [14][21] 系统级创新设计 - 采用RAG技术构建动态知识库,整合应用文档和执行日志实现"越用越强"的学习能力 [12] - PiP虚拟桌面技术利用Windows远程服务创建独立执行环境,避免干扰用户主桌面操作 [16] - 已在Excel/Outlook/Edge等20+主流Windows应用完成验证,任务成功率比OpenAI Operator高10% [18][21] 行业影响与开源生态 - 项目在GitHub获7,000 Stars,标志着桌面智能体进入系统级"AgentOS时代" [1][20] - 微软全面开源代码和文档,推动建立智能办公和人机交互的新生态标准 [19][21] - 技术框架突破传统RPA脚本依赖,为LLM-based智能体的规模化应用提供工程范本 [3][6]