AI Agent工具OpenClaw的实测表现 - 核心观点:近期备受关注的AI Agent工具OpenClaw,在《每日经济新闻》的深度实测中表现分化,其能力高度依赖所接入的大模型,且目前存在高门槛、高成本和高安全风险,尚未成为合格的生产力工具 [3][34][37] - 测试任务设定:测试设定了一项综合性任务,要求接入不同大模型的OpenClaw在电脑中检索指定采访速记稿,总结内容,结合网络资料撰写专访新闻稿,并通过邮件发送到指定邮箱,以模拟真实工作场景 [5][6] - 各模型组合实测结果分化显著:在涵盖指令理解、本地文件检索、网络搜索、信息整合写作及应用操控的多轮测试中,不同大模型组合表现差异巨大 [6][33] - OpenClaw + 千问Qwen3-Max:在首轮测试中,即便明确提示文件位置,该模型经过约5分钟检索仍无法准确定位本地文件,且邮件发送任务失败,仅重复指令无实际动作 [6][8];后续测试中,其在文件检索和网络搜索环节表现不稳定,邮件发送环节始终失败 [31][32][33] - OpenClaw + 月之暗面Kimi-K2.5:首轮测试中,该模型在5分钟内成功检索文件并完成总结,但在网络搜索环节因触发“429错误”(请求过于频繁)而失败,邮件发送环节同样失败 [11][13];后续复测中,网络搜索和邮件发送环节持续出现问题 [30][31][33] - OpenClaw + MiniMax-M2.1:首轮测试中,该模型在文件检索、网络搜索和写作方面无显著阻碍,但在邮件发送环节需人工根据其提示操作后方能解决,且发送的邮件只包含“关键引语”而非完整稿件 [16][18][20];后续两轮复测中均能完成全部流程 [31][32][33] - OpenClaw + MiniMax-M2.5:该模型在全部三轮测试中均顺利完成文件检索、网络搜索、写作及邮件发送全流程,无需人工介入 [22][31][32][33] - OpenClaw + 智谱GLM-4.7:首轮测试中,该模型在发送邮件环节会输入错误邮箱网址导致访问失败,需人工提醒更正,其他环节处理速度较快 [25];后续两轮复测中均能完成全部流程 [32][33] - OpenClaw + GPT-5-mini:该模型在三轮测试中表现最为稳定和流畅,从文件检索、内容总结、网络搜索、资料补充到邮件发送,全流程几乎无需人工干预,仅在个别时候出现网络连接不稳定 [27][32][33] OpenClaw的能力本质与行业评价 - OpenClaw本质是任务框架与指挥官:OpenClaw本身并非大模型,其角色更类似于一个“指挥官”或“任务框架”,负责接收指令、调用工具和组织流程,具体指令理解与执行工作则交由所接入的外部大模型完成,因此其最终表现高度依赖所接入大模型的能力、稳定性与表达方式 [4][34] - 业内普遍认为其能力上限取决于大模型:多位业内人士和用户指出,OpenClaw的最终表现非常依赖所接入大模型的能力,国际头部大模型上限更高,但对于普通任务,部分国产模型也已表现不错 [34] - 尚未成为合格的生产力工具:尽管部分大模型在测试中展现了执行复杂任务的潜力,但行业观点普遍认为,当前版本的OpenClaw离成为一款合格的生产力工具还有不小距离,有专家指出其在一定程度上是Claude Code的“套壳”,在核心能力上并未超越,且查询资料水准未更优 [34][35] - 进步依赖底层大模型技术突破:有观点强调,OpenClaw的进步与普及,本质上是在等待底层大模型技术的进一步跃升,等大模型能力再提升,OpenClaw的门槛就会降低 [35] - 当前版本需二次开发且不稳定:有云与AI产品经理指出,OpenClaw若要真正用于生产,还必须经过二次开发和微调,因为目前版本还“有点不成熟,很多时候会卡顿” [35] OpenClaw面临的主要挑战与局限 - 部署和使用门槛高:OpenClaw目前未提供“一键安装”方案,用户需通过命令行操作完成本地配置、依赖管理及权限设置,整个过程对使用者的技术背景有要求,至少需具备基本开发经验,这劝退了绝大多数非技术人员 [37] - 云端部署版本能力受限:虽然主流云厂商提供了OpenClaw云端部署服务,但在云端部署的OpenClaw并不能提供操控用户本地电脑的能力 [37] - 使用成本高昂,堪称“token燃烧器”:由于执行任务需频繁调用大模型,token消耗量巨大,有用户使用智谱GLM-4.7模型交互20多次就花费了200元,另有用户使用DeepSeek模型一天就“烧掉”几十元,若使用能力更强的模型,一天成本可达几百元 [37] - 成本压力影响模型选择与表现:高成本使得许多用户只能选择接入免费或更便宜的模型,但这又会影响OpenClaw的实际表现,例如有用户因成本选择Qwen-8B模型,但OpenClaw只会回答问题而不会执行操作 [38] - 内在安全风险极高,被专家称为“噩梦”:OpenClaw的定位是“做事”而非“聊天”,必须获得很高的系统权限以操控本地文件和应用,安全专家指出其“可以在用户的计算机上任意运行shell命令、读写文件和执行脚本”,这种高级权限一旦被错误配置或被恶意指令利用,后果不堪设想 [38] - 存在漏洞导致敏感信息泄露风险:网络安全专家发现OpenClaw存在漏洞,攻击者可借此获取用户数月内的私人消息、账户凭证、API密钥等敏感信息,用户为方便AI执行任务而存储的银行账户、加密货币钱包API等信息可能以明文形式保存在本地,一旦被入侵可能造成重大损失 [38] - 开发者明确提示不适合非技术用户:OpenClaw的开发者坦言这只是一个免费的开源业余项目,需要用户进行仔细配置才能确保安全,并明确表示“它并不适合非技术用户” [39]
号称“AI打工人”的OpenClaw值得用吗?每经深度实测:找不到文件、搜索报错、发邮件卡死!专家:目前远非生产力工具
每日经济新闻·2026-02-24 14:13