“爱马仕骑马”,能否复刻龙虾热?
新财富·2026-04-20 17:09

AI Agent 技术演进与行业现状 - 行业对AI的认知已超越聊天工具,转向能够直接编辑文件、处理多模态内容、学习长上下文的智能体(Agent)[4] - OpenClaw的出现是观念转变的关键,其通过标准化协议、低门槛、完善的Skill生态和本地优先的隐私优势,解决了传统Agent框架开发门槛高、工具兼容性差的问题,使普通人与中小企业得以落地应用[4] - 2026年3月,行业出现“百虾大战”,腾讯、阿里、字节等大厂均发布龙虾产品,旨在让Skill安全地协助工作,引爆了“龙虾热”[5] Harness Engineering(驾驭/治理工程)的兴起 - Agent能力提升后,管理Agent成为更重要的课题,OpenAI与Anthropic几乎同时提出Harness Engineering概念,其核心是从管理“新手”转向管理能在框架内完成系统任务的“老手”[8] - 行业经历了从提示词工程(Prompt Engineering)到上下文工程(Context Engineering),再到治理工程(Harness Engineering)的演进过程[9][10][12] - 治理工程旨在为Agent定义行为边界、制定工具调用规范、搭建自动化验证与错误恢复机制,构建全流程反馈闭环,以解决复杂任务中的逻辑跑偏、错误重复和安全失控问题[12] - 人类与AI的关系正从“操控与被操控”演变为“约束与自治”,核心目标与边界由人设定,具体任务执行与优化由AI在框架内自主完成[13] Hermes Agent 框架的特点与能力 - Hermes Agent由Nous Research团队开发,于2026年2月发布,其核心是具备自我进化能力,能在完成任务后自动提炼可复用的Skill[15][16] - 其自进化能力源于内置的Skills闭环系统,当完成涉及5个以上Skill调用的复杂任务后,系统会自动分析执行过程,生成结构化的Skill文件供后续直接调用,极大提升效率与成功率[17] - Skill具备自我改进能力,大约每经过15次工具调用,系统会触发回放分析,对Skill进行精准优化,避免重复错误并修正过时步骤[17] - 框架构建了四层记忆系统与两层缓存索引,解决了OpenClaw每次会话从零开始的问题,并通过常驻提示记忆、会话归档、技能文件层、用户建模层及周期性复盘机制,实现高价值上下文的筛选与历史信息的按需调取[18] - 在安全层面,通过Patch精准纠错机制与全流程安全扫描贯穿Skill生命周期,实现安全可控的自我迭代[18] - 在成本控制上,采用渐进式披露策略减少无效Token消耗,并以多模型分工模式降低推理开销[19] - 有测试显示,使用Hermes约两周后,Skill开始自动沉淀,同类任务速度提升约40%[19] - 该框架被指存在架构级抄袭,其核心自进化循环与中国团队EvoMap的开源引擎Evolver的10步流程高度对应[19] Hermes Agent 面临的商业化挑战 - 与OpenClaw催生众多成熟商业化产品不同,Hermes目前尚无成熟的开箱即用商业化产品[20][22] - 主要问题包括:Skill版本控制缺失,自动Patch机制会直接覆盖旧版且无历史快照与回滚能力,不符合企业级工程规范[23] - 安全扫描存在短板,仅依赖正则表达式检测恶意代码易被绕过,预留的LLM辅助审查接口未启用,无法通过企业级安全审计[23] - 索引匹配完全黑箱化,Skill调用全靠AI自主判断,无精准语义匹配机制,决策过程不可控,易导致技能复用失效或重复造轮子[23] - 采用单机存储,Skill与记忆无法跨设备自动同步,难以适配多设备切换与团队协作场景[24] - 尽管如此,作为一个完整实现自学习闭环的开源框架,其Skills系统为整个领域提供了极具价值的参考架构[25] 行业影响与未来展望 - 真正的智能被视为在约束中自我生长的能力,而不仅仅是写死的代码[27] - 为Agent设定规则框架并让其自我进化的思路,有助于人类与Agent更好地协作[27] - 预计经过工程优化或出现完善的行业级Harness框架后,Agent在行业中的应用场景将比当前使用Skills更加广泛和深入[27]

“爱马仕骑马”,能否复刻龙虾热? - Reportify