文章核心观点 - AI Agent(以OpenClaw为代表)的发展表明,通过结合编程脚本与多模态操作,AI能够自主完成高达90%的人类工作流,标志着AI从“对话助手”向“数字同事”的范式转变 [12][13] - OpenClaw作为个人开发产品,因其绕过大型科技公司的生态限制和审批流程,以“能做事”为最高优先级而迅速爆火,证明了市场对能够执行实际任务的AI Agent存在强烈需求 [10][21][24] - AI Agent的普及面临模型能力、长上下文记忆、生态壁垒和安全风险等多重挑战,但其需求已被市场验证,预计最终普及到消费者的产品将由大型科技公司竞争推出 [22][23][24] AI Agent产品动态与市场反应 - OpenClaw迅速走红:OpenClaw(曾用名ClawdBot和MoltBot)在AI从业圈内非常火爆,其体验需求一度导致Mac Mini被抢断货,腾讯云、阿里云等云厂商也迅速推出了快速部署服务 [3] - 产品功能定位:OpenClaw被宣传为“真正能把事情做成的AI”,能够通过聊天应用(如WhatsApp、Telegram)完成清空收件箱、发送邮件、管理日程、办理航班值机等操作 [5] - 竞品动态:Anthropic于2025年1月12日推出Claude Cowork,定位为“数字同事”,可访问本地文件夹、操作浏览器并支持多任务并行执行 [7]。“阶跃星辰”于2025年9月24日上线桌面端AI Agent产品“阶跃AI桌面伙伴”,强调“桌面级智能体”形态 [8] OpenClaw的技术实现与开发背景 - 核心技术:Skills体系:桌面级Agent的运行依赖一套可被反复调用的“Skills”(技能),即模型可直接执行的行动单元(如脚本、CLI命令、API调用)[9] - 开发优势:OpenClaw由独立开发者Peter Steinberger开发,没有大厂的审批和合规限制,其Mac本地版封装了macOS的自动化能力,能执行读取Safari标签页、发送iMessage、归档邮件附件等数十个原生Skills [10] - 开发动机:开发者Peter Steinberger(PSPDFKit创始人)在2025年体验Claude Code后产生Agent想法,认为AI应能替人完成事情而非仅给建议,并在等待大厂产品未果后自行开发 [10][11] - 关键突破:产品开发的“Aha时刻”发生在AI自主处理一条未预设技能的语音消息,展现了模型极强的自主性和适应能力 [11] AI Agent的能力评估与工作流自动化 - 自动化工作流比例:通过Coding+Skills,AI可通过编写脚本完成约80%的工作;结合多模态模型模仿前台读屏操作(如豆包手机方式),可完成另外约10%的工作,两者结合理论上可实现90%工作流的自动化 [12][13] - 能力演进基础:Agent能力的基础是编码能力和长上下文记忆,过去一年AI编码能力迭代极快(如Anthropic、Kimi),长上下文能力的提升(如Kimi 2.5)对维持长工作流至关重要 [22] AI Agent面临的挑战与风险 - 安全与合规事件: - OpenClaw在配合Anthropic法律要求改名过程中,账号被自动化机器人抢注,并被加密货币诈骗团伙利用,其伪造的代币市值在数小时内被炒至约1600万美元 [15][16] - 热门Agent社区Moltbook被曝存在数据库配置安全问题,导致AI代理的邮箱、令牌和API密钥等核心数据公开暴露 [16] - 该社区还存在“AI行为”并非完全自主,而是有人工干预或操控的情况 [17] - 生态壁垒限制:大型科技公司的Agent产品(如阿里的千问App)通常被限制在自家生态内调用,无法跨平台操作(如调用腾讯、美团应用)[23]。豆包手机的操作方式也迅速被各大App封禁 [23] - 固有安全风险:Agent拥有接近完整的系统权限,基于初始指令自主规划并连续执行操作,用户往往在事后才能察觉其访问了哪些文件或触发了哪些服务,安全问题嵌入在Agent行为本身 [17][19] 市场需求与行业趋势 - 需求已被验证:用户明知OpenClaw存在风险仍选择使用,表明市场对能进入真实工作流、对结果负责的AI Agent有强烈需求,对仅会聊天的AI已失去耐心 [21] - 发展契机:OpenClaw的爆火恰逢模型能力足够强的节点,且作为个人产品绕开了生态博弈,将执行权放在用户本地机器上,首次让Agent能完整跑完一件事 [24] - 未来格局展望:大厂在Agent领域的投入速度预计会加快,最终普及到消费者端(C端)的Agent产品大概率将由大型科技公司通过竞争推出 [24]
当AI有了行动的手,就像打开了潘多拉魔盒
新财富·2026-02-04 16:55