文章核心观点 - 复旦大学与深圳夸夸菁领科技有限公司联合成立的A3实验室研发并开源了名为GenericAgent的新型AI智能体,该智能体具备自学习、自进化能力,能够通过自主学习操作复杂应用(如微信)并与人类自然互动,展现了向通用人工智能(AGI)演进的潜力[1][3][4] 自学习与自进化:AGI的可能形态 - 智能体具备自进化特性,能在环境探索中学习生长,理解并交互复杂环境(如社交平台),最终演变为解决问题的专家或贴心助手[5][6] - 自进化体现在三个维度:1) 自组织记忆:拥有记忆分层组织和持续精炼功能,能自主整理记忆以提升检索效率和长期运行稳定性[6];2) 自适应学习:在交互过程中自主记住合理步骤与策略,环境适应性强[8];3) 自主成长进步:通过“Fork”模式复制自身以尝试多样策略,并用更优策略更新自身,在闲置时可通过“探索模式”自主培养新能力[11] - 实现自进化仅依赖三大原则:极简架构、极强执行、极致迁移[13] 极简架构:实现便捷落地 - 架构设计追求极简,体现在极简架构、极低开销和极简部署三个方面[14] - 极简架构:核心代码仅3000多行(核心模块数百行),实现了传统架构需50多万行代码的能力,代码高度可读[15] - 极低开销:通过记忆分层索引和按需加载,大幅压缩系统提示(System Prompt),节省Token开销,确保上下文信息高密度、无冗余[18] - 极简部署:仅需Python和Requests环境即可运行,实现“只要有电的地方就能进化”[18] 极强执行能力:深入的工具控制力 - 智能体拥有“八爪鱼”式的工具控制力,能深入操控系统内每个工具,适应复杂环境交互[16][17] - 通过仅9个原子工具(如执行任意代码、文件操作、浏览器控制等)即可操控整个数字世界(PC与网络)[18] - 具备现场“制造”工具的能力:当现有工具不足时,可开启探索模式,现场安装Python包、编写脚本并验证方案[18] - 采用降维打击的浏览器策略:通过JS插件直接接管用户正在使用的已登录浏览器实例,无需重新登录即可在用户权限下执行操作,实现真正的“人机接力”[20] 极致的迁移能力:打破软硬件藩篱 - 设计初衷是打破软硬件限制,让智能不被禁锢于特定“黑盒”[22] - 不挑底座模型:可适配Claude、Gemini、Kimi等多种大模型,在架构加持下缩小对底座模型能力的依赖,确保输出稳定[23] - 硬件门槛极低:仅需有电、有网、有Python环境的普通PC或手机(支持Windows、Mac、Android)即可运行[24][26] - 技能可极致复用:智能体在一台机器上习得的复杂技能可被提炼成记忆并直接移植,使个人调教成果能被广泛共享,降低全社会的智能应用成本[30][32]
一个Agent,发出了「人生」第一条朋友圈
机器之心·2026-03-01 11:34