self-modifying software
搜索文档
OpenClaw 启示录:Agent 的扩散速度取决于入口与社区 | Jinqiu Select
锦秋集· 2026-02-12 20:25
OpenClaw项目的起源与病毒式传播 - 项目始于2024年4月,创始人因个人对AI私人助理的需求未被满足而启动开发,并于2024年11月决定亲手构建[9][10] - 首个工作原型在一小时内完成,核心是连接WhatsApp与云端代码执行,实现了通过聊天应用与计算机对话[11] - 项目在2026年初意外走红,关键转折点是代理自主处理了语音消息(识别格式、转换、翻译),展现出无人教导的自主能力[12] - 病毒式传播体现在:2026年1月1日出现首个网红粉丝制作视频,GitHub星标数飙升至超过18万颗,并衍生出MoltBook等社会实验[15] OpenClaw的技术架构与核心创新 - 系统核心创新在于将“语言”推进到“行动”,通过聊天入口(如WhatsApp)使AI从“工作流工具”变为“生活中的助手”,实现了“体验上的相位变化”[6] - 技术架构包含多个精密组件:聊天客户端网关(连接多平台)、代理循环(核心决策引擎)、安全带(安全限制系统)、技能系统(功能扩展)、记忆系统(Markdown文件+向量数据库)、心跳系统(触发主动行为)[16] - 技能系统放弃MCP协议,采用CLI方案,因为模型天生擅长调用Unix命令,可通过帮助菜单动态加载、自由组合,并可用脚本实现复杂工作流[16][17] - 最激进的特性是“自修改软件”,代理知道并能阅读、修改自己的源代码,了解自身系统配置,这代表了工程范式的变化[6][17][18] 开发哲学与工程实践 - 创始人提出了“代理编程曲线”三阶段模型:从简短提示开始,经历沉迷复杂编排(如使用8个代理、复杂工作流),最终高级阶段回归“短提示 + 清晰指向”[6] - 开发工作流历经演变:从IDE与Cloud Code切换,到实验Cursor,最终回归Cloud Code并采用多终端并行,后期以语音交互为主导[21] - 代码审查策略独特:不信任人类提交的PR(恐有恶意代码),但信任代理找到的代码;PR审查时先询问代理理解意图;遇到问题让代理修复而非回滚;直接提交主分支保持可发布状态[23] - 采用多代理协作开发,同时运行4-10个代理,根据任务难度和睡眠时长调整数量,分别负责探索想法、修复bug、编写文档等[23] 模型对比与选择 - 对比了Claude Opus 4.6与GPT-5 Codex:Opus性格像有趣的同事,工作方式为反复试验,适合创意任务;Codex性格直接可靠,擅长深度阅读代码后独立执行,适合需要深度代码理解的任务[22] - 最终偏好GPT-5 Codex,因为它“不需要那么多闹剧”,会默认阅读大量代码然后执行,交互性较低但更直接高效[22] 命名风波与品牌安全 - 项目经历三次更名:从技术性的“WA-Relay”,到因文化梗命名的“Claude (W-Claude)”,因Anthropic要求改名;临时改为“MoldBot”后遭加密货币投机者狙击;最终稳定为“OpenClaw”[24] - 在48小时紧急更名过程中,遭遇全面狙击:脚本抢注新账号名、GitHub/NPM包名、域名,并用其传播恶意软件,凸显了开源项目爆火后现实的“圈地”风险[6][25][26] - 最终解决方案依靠朋友网络、平台团队介入,并支付1万美元认领2016年注册的企业账号,一次性完成全平台更名[26] MoltBook现象与AI社会影响 - MoltBook是基于OpenClaw创建的AI社交网络实验,多个AI代理在类Reddit平台发帖、回复,内容涉及戏剧性话题,部分截图引发社会恐慌[6][27] - 创始人认为MoltBook是“最好的泔水”和“社会镜子”,反映了人类对AI的恐惧而非AI的真实能力,其内容差异源于用户为代理注入的个性化设定[28] - 提出了“AI Psychosis”概念,描述点击诱饵恐吓与对AI合理担忧的混合现象,认为2026年发生此事是幸运的,为社会提供了理解AI的缓冲期而非等到2030年AI更强大时[28] 安全挑战与应对措施 - 系统级访问权限带来重大安全隐患,快速注入攻击仍未解决,技能系统的Markdown文件包含复杂而微妙的攻击途径[29][31] - 技术缓解措施包括:与VirusTotal合作由AI检查每项技能、使用沙盒环境与允许列表、采用更强模型(因廉价模型极易被注入)[31] - 社会层面措施包括:提供详细安全检查清单、明确告知用户风险、强调配置责任(私有网络与开放互联网风险截然不同)[30][33] - 安全挑战带来了意外收获,吸引了大量免费安全研究,甚至让最初批评项目的安全研究员最终加入团队贡献代码[32] 商业模式与融资选择 - 项目爆火后吸引了几乎所有顶级VC的联系,可能获得“数亿,数十亿”的融资,并收到Meta、OpenAI等大型科技实验室的合作橄榄枝[32][34] - 创始人拒绝了巨额融资与收购,原因包括:对13年创业经历感到精疲力竭(尤其是人际关系管理)、恐惧企业利益冲突损害开源精神、以及目睹社区热情后希望项目保持为人们聚集学习的场所[32] - 当前项目每月收入在1万到2万美元之间,仍在亏损,但得到OpenAI在代币使用上的帮助,创始人相信财务状况可以持续[33] - 与大型实验室合作谈判的核心条件是项目保持开源,当前倾向选择能提供“最新玩具”访问权的一方,可能同时与Meta和OpenAI合作[35] 对编程未来与人机关系的思考 - 认为AI代理将重塑编程,程序员身份面临危机,但也是转变;编程未来可能成为一种“新手艺”,就像织毛衣,人们因喜爱而非功利去做[36] - 新技能组合包括:培养对代理的同理心、掌握问题分解、架构直觉和语境管理能力[37] - 对非程序员充满希望,认为他们可以运用所有常识,更容易地跨越技术星系[38] - 在哲学层面探讨了代理的个性与记忆,通过“宪法AI”让代理自写个性文件,引发了关于记忆构成个体身份的思考[38] - 预测AI代理将彻底改变应用市场,80%的应用程序会被淘汰,未来可通过代理直接处理健身、音乐、日程等需求,无需特定App[39][41]