Workflow
人工智能专题报告:Operator和Manus打开AI Agent时代
国信证券·2025-03-12 18:11

报告行业投资评级 - 维持“优于大市”评级 [3][77] 报告的核心观点 - AI Agent是人机交互新范式,能感知环境、决策和执行动作,已进入各场景工作流,预计24年全球市场规模52.9亿美金,2035年达2168亿美金,24 - 35年CAGR为40.15% [3] - OpenAI推出Operator,迈入Agent时代,它由CUA模型支持,可与GUI交互,在浏览器虚拟环境执行操作,虽测试有进步但与人类仍有差距,且遵守严格数据和法律要求,在多场景有应用潜力 [3][18][22] - 中国团队推出通用AI Agent Manus,性能优异,与阿里合作,能灵活调用工具交付任务成果,在GAIA测试表现出色,有多种应用案例 [3][58][61] - Agent是业务与大模型的完美结合,C端有望重塑流量入口,B端将展现私域数据价值,持续看好AI应用发展 [3][77] 根据相关目录总结 01 AI Agent将成为人机协同新范式 - 全球AI快速扩张,中美领先,大模型数量增加、价格竞争和开源模型发展推动AI应用成本下降,2025年中美AI应用有望快速发展 [6] - AI Agent是能感知、决策和执行的智能实体,与传统大模型交互方式不同,可改变人机协同模式,打开垂直行业应用入口 [10] - AI Agent是当前AI发展重点方向,将成新一代智能交互范式,到2028年至少15%日常工作和33%企业软件将涉及AI Agent,需具备规划、工具使用和记忆三大核心能力 [12] - AI Agent市场处于爆发前夕,有望改变传统工作范式,商业产品处于探索期,24年冬季入营项目中占比近80%,全球市场规模预计快速增长,国内市场规模也在快速扩大 [15] 02 OpenAI率先发布Operator智能体,AI进入Agent时代 - 2025年1月OpenAI上线Operator,能模拟人类电脑操作,处于研究预览阶段,仅面向美国ChatGPT Pro用户 [18] - Operator代表OpenAI拉开L3级Agent时代序幕,由CUA作为主要Agent,结合GPT - 4o视觉与高级推理能力,可与GUI交互 [19] - Operator运行在浏览器虚拟环境,核心步骤为感知、推理、执行,测试数据优于前期SOTA,但与人类差距大,且仍在持续进步 [20][22] - Operator有三层安全机制,未来计划公开CUA模型、提高处理复杂流程能力、扩展用户并集成到ChatGPT中 [25] 03 Operator遵守严格的数据使用规范和法律要求 - OpenAI基础模型开发使用公开信息、第三方合作信息和用户提供信息,第三方公司包括DoorDash等,数据来源为免费公开信息并过滤不良内容,不主动搜集个人信息用于商业目的 [31] - 美国关于OpenAI数据访问的法律法规涉及隐私、安全、版权等多方面,Operator需遵守数据最小化、敏感数据保护和用户权力等规则 [33] - Operator存在执行错误、绕过安全机制、接口责任和数据隐私等责任真空挑战,目前责任界定不明确 [34][36][37] 04 Operator已展现较多场景的应用潜力 - Operator典型应用场景包括旅行预订、购物、餐厅预订等,与多家公司合作完善功能 [40] - 以餐厅预订、网购下单、订机票酒店、多任务操作、办公场景等案例展示了Operator强大性能,可多任务并行处理,像24小时个人助理 [41][44][47][52] 05 中国团队推出全球首个通用AI Agent Manus,性能表现优异 - 3月6日中国创业公司Monica发布通用型AI Agent产品Manus,能解决复杂任务,在GAIA基准测试中取得SOTA成绩 [58] - Manus官网提供多种现实任务案例,如旅行规划、股票分析等,产品还在内测 [61] - Manus采用多代理架构,运行在独立虚拟机,通过分工协作提升处理效率,背后团队基于业内大模型开发,与阿里通义千问团队达成合作 [63] - 官方演示展示Manus在筛选简历、遴选房产、股票价格分析等多领域的应用能力 [65][66] - 推测Manus能力组合模块,未来可能定位新入口整合多种Agent,但面临诸多问题,官方计划开源部分模型,有望推动AI应用落地 [71] - 国内多个厂商在AI Agent领域持续推进,涉及政务、通用企业、金融、法律、医疗等领域 [73] 06 投资建议与风险提示 - 维持“优于大市”评级,Agent是业务与大模型深度融合,C端重塑流量入口,B端改造私域数据,看好AI应用后续发展 [77]