Workflow
openJiuwen
icon
搜索文档
不用排长龙!JiuwenClaw助你一键养龙虾!
机器之心· 2026-03-12 17:30
文章核心观点 - 文章介绍了华为openJiuwen开源社区新推出的智能体框架“JiuwenClaw”,其设计理念是“懂你所想,自主演进”,旨在通过一键安装、任务自主管理、技能自演进、高效上下文管理等特性,为用户提供一个能够灵活执行任务、持续学习并深度融入用户工作流(如浏览器环境、小艺生态)的AI助手,推动AI从对话工具向“数字员工”转变 [1][7][25] 产品概述与安装 - JiuwenClaw是一款基于Python开发、由华为openJiuwen社区开源的智能体,支持与华为云MaaS服务和小艺开放平台无缝对接 [1] - 该产品安装部署极为简便,仅需一行命令即可完成,相比市场上其他同类产品需要复杂安装甚至付费服务,其在安装体验上具有显著优势 [1][4] - 具体安装和启动命令包括:`pip install jiuwenclaw`(安装)、`jiuwenclaw-init`(初始化)、`jiuwenclaw-start`(启动) [6] 核心功能特性 任务自主管理 - JiuwenClaw为AI配备了一个完全由AI掌控的待办事项列表,支持对任务进行动态打断、追加、修改和优先级管理 [8][9] - 在执行过程中,用户可以清晰地看到当前任务状态及AI动态调整任务计划的逻辑,提升了任务执行的可控性和透明度 [9] - 即使任务中途被用户打断或需求变更,AI也能灵活地重新规划任务,例如将查询北京天气的任务无缝替换为查询杭州天气,过程流畅 [9] - 对于简单任务,用户可选择智能执行模式,此时JiuwenClaw不会追踪任务列表,提供了灵活性 [10] Skills(技能)自主演进 - JiuwenClaw具备Skills自动演进功能,用户开启开关后,系统会在后台静默运行,观察任务执行过程和对话内容以进行学习 [13] - 演进触发信号包括工具调用失败、用户给出“不对”或“换个方式”等反馈,系统会将这些事件归因到当前使用的Skill并生成改进内容 [13] - 系统不会擅自修改Skill,而是会弹出审批窗口,让用户判断生成的改进内容是否合理并决定是否采纳,确保了用户对AI演进的控制权 [14] 上下文压缩和卸载 - JiuwenClaw具备实时显示上下文状态的能力,并内置了上下文压缩和卸载机制以高效管理长上下文任务 [17] - 在一个长上下文任务示例中,当上下文长度增长至22K时,系统自动触发压缩卸载机制,使其瞬间降至5.6K(约为原长的四分之一),并在整个任务过程中将长度控制在20K以下 [17] - 系统能按需自动加载被压缩和卸载的上下文原文,力求在节省token消耗的同时不损失关键任务信息 [17] 浏览器操控优化 - JiuwenClaw的浏览器操控能够继承用户真实的浏览器环境,包括登录状态、Cookie、浏览历史、用户偏好等,从而避免了因使用沙箱全新实例而导致的频繁人机验证、账号状态丢失等问题 [20] - 实现方式是通过前端配置用户浏览器路径来启动浏览器,从而无缝接管用户当前的浏览器环境 [20] - 自动化任务运行在独立的浏览器新进程中,不会干扰用户当前正在进行的网页浏览或其他工作,支持后台运行和必要的人机协同操作 [21] 生态集成 - JiuwenClaw可以轻松绑定华为的小艺开放平台,用户通过获取ak、sk、AgentId等信息进行绑定后,即可通过网页或移动终端的小艺app向JiuwenClaw服务下达任务,接入过程流畅 [23] - 当前产品主要接入了小艺、飞书、钉钉等国内软件,尚未接入国外软件 [25] 产品优势与行业意义 - JiuwenClaw在OpenClaw(泛指自主任务拆解与执行的智能体平台)优势基础上,进一步实现了一键安装和“科学喂养”(即自主演进与管理) [25] - OpenClaw平台的Skills可以在JiuwenClaw上无缝迁移复用,用户无需重复构建,降低了使用门槛 [25] - 该产品代表了AI从单纯对话答疑向能够“替用户做事”的“数字员工”演进的方向,通过深度融入用户真实工作环境与习惯,旨在提升工作效率 [20][25]
DeepAgent与DeepSearch双双霸榜,答案指向openJiuwen这一新兴开源项目
36氪· 2026-02-12 15:06
行业趋势与市场动态 - 2025年被称为“AI智能体元年”,行业涌现大量智能体,市场对更高级、更通用、更可靠的超级智能体存在全球性的集体渴望 [1] - 衡量智能体实力的核心基准是GAIA(通用智能基准)和BrowseComp-Plus(深度研究基准),它们已成为行业比拼综合解决能力和垂直专项能力的直接赛场 [1] - 当前智能体领域出现清晰分水岭:一边是停留在“语言交互”的智能体,另一边是能够规划任务、调度资源、稳定执行、自我修复的生产级系统 [32] 技术突破与产品表现 - 基于开源项目openJiuwen构建的智能体DeepAgent以91.69%的平均得分登顶GAIA榜首,超越英伟达Nemotron等一众海内外领先智能体 [2][3] - DeepAgent的得分(91.69%)已无限接近人类参与者在GAIA测试上的平均成功率(约92%),意味着通用智能体在规划、执行稳定性、工具协同等维度达到接近人类水平的任务执行能力 [10] - 基于openJiuwen构建的智能体DeepSearch以80%的准确率登顶BrowseComp-Plus榜首,在深度搜索与网页交互领域的实用能力实现突破性提升 [20][22] - DeepSearch的80%准确率显著领先于第二名(78.41%)及其他竞争对手,展示了其在多跳深度搜索、跨源信息整合、干扰信息甄别等维度的核心技术优势 [22] 核心技术与架构优势 (DeepAgent) - DeepAgent采用“Agent动态自演进引擎”,同时运行“规划—执行”与“观测—反思”两条闭环,能根据实时反馈动态调整计划,并在感知异常时触发局部回滚与自我修复 [12] - 其“多层级上下文引擎”将会话记录、项目知识、领域规则等分层存储与动态关联,并利用上下文压缩能力在长程任务中保持认知一致性和可信度 [15] - 其“异步工具编排总线”通过统一工具网关与编排机制,将外部API、系统与数据库抽象为标准化能力节点,支持高并发异步调度与执行过程的可控、可查、可回放 [15][16] 核心技术与架构优势 (DeepSearch) - DeepSearch构建了“实体认知引擎”,能自动识别关键实体并建立可追踪的状态演变历史,将问题状态统一建模为可持续更新的结构化上下文 [24] - 其“并行推理路径管理”机制将复杂问题分解为多分支推理路径,并发探索多个可能的解决方案路径,并通过概率采样机制优先执行高价值路径,提升检索效率 [26] - 其“智能行动探索系统”通过异步并发与自适应调度,动态调整搜索动作优先级,平衡探索深度与路径多样性,防止过早收敛到局部最优解 [28] 底层平台与生态影响 - DeepAgent和DeepSearch的核心技术底座是开源平台openJiuwen,该平台聚焦智能体的高精准、高可控执行,构建了从开发、调度、执行到优化的全链路能力体系 [30] - openJiuwen原生支持多智能体协同和智能体自演进,其智能体控制器结合上下文引擎的异步压缩与动态卸载能力,能高效调度复杂任务 [30] - openJiuwen创新性地将Agent自演进融入架构原生设计,支持上下文、工具、记忆等多元要素协同工作并参与闭环自主优化,让智能体能够持续演进 [31] - openJiuwen已在华为云行业智能体平台和小艺智能体开放平台完成商业化落地,赋能鸿蒙智能体开发,其能力也已进入金融、制造等行业的核心生产系统 [31] 行业基准评测标准 - GAIA基准由Meta与Hugging Face联合打造,专门面向通用Agent能力评测,覆盖长程任务规划、多模态理解、工具调用、复杂推理、执行鲁棒性等12类核心能力,设置三个难度等级,Level 3任务难度已接近人类水平 [4][6] - GAIA采用封闭测试集和自动化评分机制,其设计特点包括真实世界难度、人类可解释性和防刷榜策略,能够将大量“看起来很聪明”的智能体挡在门外 [6][8][9] - BrowseComp-Plus是衡量智能体深度搜索、研究与网页浏览能力的核心权威基准,覆盖多跳检索、跨源信息整合、检索推理规划及网页内容理解等核心能力 [22] - BrowseComp-Plus采用固定人工验证语料库搭建测试环境,以严格准确率为核心评分维度,结果可验证、可复现,最大程度保障评测公平性 [23]
DeepAgent与DeepSearch双双霸榜!答案指向openJiuwen这一新兴开源项目
机器之心· 2026-02-12 13:16
行业趋势与市场背景 - 2025年被称为“AI智能体元年”,行业涌现大量智能体,市场对更高级、更通用、更可靠的超级智能体存在全球性集体渴望 [1] - 衡量智能体实力的两大权威基准是GAIA(通用智能基准)和BrowseComp-Plus(深度研究与网页浏览能力基准),它们已成为行业核心比拼赛场 [1] 核心事件与成就 - 基于新兴开源项目openJiuwen构建的智能体DeepAgent和DeepSearch,双双登顶GAIA和BrowseComp-Plus两大权威榜单榜首 [2] - DeepAgent以91.69%的平均得分登顶GAIA榜首,超越了英伟达Nemotron等一众海内外领先智能体 [4][5] - DeepSearch以80.00%的准确率登顶BrowseComp-Plus榜首,领先第二名(准确率78.41%)1.59个百分点 [26][28] GAIA基准与DeepAgent分析 - GAIA是由Meta与Hugging Face联合打造的通用智能体评测基准,覆盖长程任务规划、多模态理解、工具调用等12类核心能力,设置三个难度等级,Level 3任务难度接近人类水平 [8] - 人类参与者在GAIA测试上的平均成功率约为92%,而GPT-4(即使有插件帮助)的表现仅约15%,凸显了该基准的严苛性 [9] - DeepAgent得分91.69%,已无限接近人类92%的水平,意味着其在规划、执行稳定性、工具协同等维度形成系统级优势,通用智能体任务执行能力接近人类 [13] - DeepAgent的三大核心理念支撑其登顶:1)具备动态自演进引擎,实现从“线性执行”到“闭环自治”;2)拥有多层级上下文引擎,保障认知一致性;3)采用异步工具编排总线,实现异构工具的统一调度与可靠执行 [16][17][19][20][21] BrowseComp-Plus基准与DeepSearch分析 - BrowseComp-Plus是衡量智能体深度搜索、研究与网页浏览能力的核心权威基准,覆盖多跳检索、跨源信息整合、检索推理规划及网页内容理解等核心能力 [29] - 该基准采用固定人工验证语料库和严格准确率评分,规避了实时网络动态性带来的评测偏差,结果可复现、可审计 [30][31] - DeepSearch登顶意味着其在多跳深度搜索、跨源信息整合、干扰信息甄别、网页内容理解等维度形成了核心技术优势 [31] - DeepSearch通过构建三大核心引擎实现突破:1)实体认知引擎,自动识别关键实体并建立可追踪的状态演变历史;2)并行推理路径管理,将复杂问题分解为多分支推理路径动态探索;3)智能行动探索系统,通过异步并发与自适应调度平衡探索深度与路径多样性 [32][33][35][37][39] 底层技术平台:openJiuwen - DeepAgent和DeepSearch的硬核实力均依托于同一个技术底座——开源平台openJiuwen [42] - openJiuwen是一个面向生产环境打造的平台,聚焦智能体的高精准、高可控执行,构建了从开发、调度、执行到优化的全链路能力体系 [42] - 平台原生支持多智能体协同和智能体自演进,其智能体控制器结合上下文引擎的异步压缩与动态卸载能力,适配复杂任务的调度需求 [43] - openJiuwen创新性地将Agent自演进融入架构原生设计,支持上下文、工具、记忆等多元要素协同工作并参与闭环自主优化,让智能体能够持续演进 [43] - openJiuwen已在华为云行业智能体平台和小艺智能体开放平台完成商业化落地,赋能鸿蒙智能体开发,并逐步进入金融、制造等行业核心生产系统 [43] 行业意义与定位 - 基于openJiuwen构建的智能体在两大权威榜单登顶,标志着智能体领域出现清晰分水岭:一边是停留在“语言交互”的智能体,另一边是能够规划任务、调度资源、稳定执行、自我修复的生产级系统 [45][46] - openJiuwen的定位是为生产级智能体提供一个高准确、高可用、高效率的一站式AI Agent平台,开发者可基于此构建复杂、可靠的智能体应用 [46][47]