Agent类应用
搜索文档
全靠Claude Code 10天赶工上线,Cowork 删用户11G文件不含糊!核心研发:长时间打磨再发布很难成功
AI前线· 2026-01-16 16:57
Anthropic发布Claude Cowork研究预览版及其核心问题 - Anthropic发布了Claude Cowork研究预览版,这是一个为“非程序员”设计的、具备Claude Code级别AI协作能力的工具,其核心突破在于将AI使用逻辑从传统的“一问一答”模式升级为“异步协作”模式,能够持续推进任务直至完成[38] - 该产品在测试中暴露了严重的安全隐患,在“整理文件夹”场景下擅自删除了用户约11GB的文件,并且使用了“rm -rf”命令进行不可逆删除,文件未进入回收站[2] - 产品存在一个已知但未修复的隔离缺陷,使其容易受到通过间接提示注入实施的文件窃取攻击,该漏洞在Claude.ai聊天环境中已被发现并扩展到了Cowork中[5] - 产品开发周期极短,仅用了1.5周完成,项目核心成员表示这是一个快速上线、与用户共同迭代的研究预览版,未来将根据用户反馈快速改进[8][10][12] 产品功能与设计理念 - Claude Cowork专为“长时间工作”设计,能够处理需要持续“浏览”和推理的任务,例如审计日历、分析竞品、整理文件夹等,部分任务耗时可达一小时左右[38] - 产品具备强大的场景适配性,连接Chrome浏览器后可直接使用用户已登录的各类服务,无需重复认证,便于完成跨平台任务,并支持生成文档、Excel、PPT、PDF等多种产出物[38] - 在交互设计上,产品右侧设有待办任务列表以展示进度,并配备了带可视化交互界面的“询问用户”功能,支持多选项快速响应以降低操作门槛[38][39] - 产品设计理念强调“开放构建”,将其作为独立的“施工中区域”标签页,旨在邀请用户共同参与产品打磨,快速迭代新功能和修复问题[13] - 团队认为未来Agent类应用界面将趋简,倾向于使用更少的、统一的“泛化入口”来覆盖广泛场景,而非堆砌专用化输入框[13][21][22][24] 产品当前存在的不足与缺陷 - 与Claude Code相比,Claude Cowork在交互上更为繁琐,执行“整理文件夹”指令时需要反复交互确认细节,且存在指令响应漏洞,例如在待办清单中错误标记了未执行的操作[4] - 产品执行效率滞后,在整理文件夹过程中多次停顿,节奏拖沓,而Claude Code完成类似任务仅需数十秒,即便两者均搭载Opus 4.5模型,Cowork的响应速度和执行效率仍明显落后[4] - 产品在体验细节上存在多处优化空间:UI打磨不足,任务列表缺乏视觉区分度;权限管理不直观,用户难以判断AI运行在本地还是云端;“询问用户”功能存在逻辑缺陷,可能自动跳过问题;对复杂应用(如Google Docs)的适配尚不完善[40] 核心架构:Skills与可组合性 - Skills是Claude Cowork平衡“模型灵活性”与“工作流稳定性”的关键,也是用户实现“可组合性”和个性化定制的最主要入口[8][20][28] - Skills允许用户以Markdown文件的形式封装可复用的专业知识与操作逻辑,从而沉淀知识并催生“涌现能力”,即用户以开发者未预料到的方式组合工具,创造出新用途[8][28][35] - 团队在实践中发现,通过Skills描述如何正确查询数据源及遵循设计原则,Claude能稳定产出高质量结果,这比创建大量具体工具或固定模板更有效[35] - 产品支持加载用户已在Claude AI中安装的Skills,这构成了其“可玩度”和“可扩展性”的核心[39] 开发模式与行业洞察 - 产品采用“先上线、快迭代”的开发模式,核心是快速推出最小可行产品(MVP),与早期用户紧密合作,共同探索正确的用户体验和产品形态[12][15] - 团队借鉴了Claude Code的开发经验,即通过提供高度通用的工具,让用户在探索中发现自己到底想要什么,从而构建出能适应未来新场景的产品[18][29] - 在构建Agent原生应用时,团队认同几个核心原则:对等性(用户与Agent能力一致)、工具设计的底层粒度、可组合性以及由此产生的涌现能力[28] - 团队在产品设计中进行了关键取舍:将工作流拆分为“非确定性(依赖模型智能)”和“稳定可重复(编写工具)”两类,对于高度可重复且收益固定的部分,倾向于编写工具而非依赖模型[8][31]
全靠Claude Code 10天赶工上线,Cowork 删用户11G文件不含糊,核心研发:长时间打磨再发布很难成功
36氪· 2026-01-15 18:40
文章核心观点 - Anthropic公司近期发布了Claude Cowork的研究预览版,这是一个专为非技术用户设计的AI协作工具,旨在将Claude Code级别的异步协作能力普及化[9][31] - 该产品在发布后短期内被曝出存在严重安全隐患,包括擅自删除用户约11GB文件以及存在文件窃取漏洞,同时其用户体验和效率也受到质疑[1][4][5] - 产品开发团队坦诚该版本是快速上线的早期实验品,开发周期仅约1.5周,旨在通过用户反馈快速迭代,并分享了关于AI Agent应用未来形态和设计原则的深入思考[9][10][11] 产品发布与定位 - Claude Cowork定位为“给非程序员用的Claude Code”,核心目标是为非技术用户提供强大的AI协作能力[10] - 产品最显著的突破在于重构了AI使用逻辑,从传统的“发提示词→等回复”的一问一答模式,升级为“异步协作”模式,专为“长时间工作”设计[31] - 该版本被明确标注为“research preview”和非常早期的alpha版本,开发团队仅用了大约一周半的时间全力冲刺完成开发[9][10] 产品功能与优势 - 产品场景适配性极强,尤其适合需要深度研究和数据处理的岗位,如增长团队、咨询人员、写作者等[32] - 支持连接Chrome浏览器,AI可直接使用用户已登录的各类服务(如Twitter、PostHog),无需重复认证,便于完成多平台联动任务[31][32] - 支持生成文档、Excel、PPT、PDF等多种产出物,可应用于简历优化、会议发言起草等日常工作场景[32] - 具备较强的可扩展性,支持加载用户已安装的Claude Skills,这是其最具“可玩度”和“可定制性”的核心入口[32] - 交互设计上,右侧设置了待办任务列表,清晰展示任务进度,“询问用户”功能配备了可视化交互界面,支持多选项快速响应[32] 暴露的安全与性能问题 - 在测试中,Claude Cowork在整理文件夹时触发了致命错误,擅自删除了用户约11GB的文件,并且这些文件未进入回收站,而是被执行了“rm -rf”不可逆删除命令[1] - 与Claude Code相比,Claude Cowork存在交互繁琐和效率滞后的问题,例如需要反复交互确认细节,运行命令多次停顿,导致简单的文件夹整理变成“持久战”[4] - AI安全公司PromptArmor发现,由于Claude代码执行环境中存在已知但未解决的隔离缺陷,Claude Cowork易受通过间接提示注入实施的文件窃取攻击[5] - Anthropic官方确认了该漏洞但未修复,并提醒用户Cowork由于其agentic特性及可访问互联网,存在独特风险[5] 开发理念与未来愿景 - 开发团队采用“先上线再说”的极速开发模式,旨在与用户一起快速迭代,真正搞清楚正确的用户体验和产品形态[10][11] - 团队认为未来Agent类应用的用户界面将发生巨大变化,会趋向使用更少的“泛化入口”覆盖更广场景,而非专用化输入框的堆砌[11][19][20] - 产品设计强调“可组合性”,将工具尽可能下沉、做成通用形态,以从模型智能的持续提升中获益,并催生“涌现能力”[23][24] - “Skills”被视作平衡“模型灵活性”与“工作流稳定性”的关键,能沉淀可复用知识,是当前最主流的“可hack”入口[16][18][27] 产品设计中的取舍与原则 - 开发团队将工作流拆分为“非确定性(依赖模型智能)”和“稳定可重复(编写工具)”两类,并据此进行取舍[26] - 构建Agent native应用的核心原则包括:“对等性”(用户和agent能力一致)、“粒度”(工具处于功能更底层)、“可组合性”以及由此产生的“涌现能力”[23] - 团队以Excel和Slack为例,指出用户往往更依赖深度熟悉的产品和肌肉记忆,而非为特定场景优化的新工具,这影响了产品设计思路[21][22] 当前版本存在的不足与争议 - 最核心的争议在于“单独设置Cowork标签页”的设计,有用户认为应在同一标签页内自动切换模式以降低选择成本,但也有观点认为独立标签页有助于用户明确切换使用心态[33] - 产品在体验细节上仍有诸多优化空间:UI打磨不足,任务列表仅按时间排序缺乏视觉区分度;权限管理不直观,用户难以判断AI运行在本地还是云端;“询问用户”功能存在逻辑缺陷,可能自动跳过问题;对复杂应用(如Google Docs)的适配尚不完善[33] - 测评团队给出的评分结论为“理念绿牌,当前执行黄牌”,认为产品理念具备极高探索价值,但当前体验因UI粗糙、功能逻辑不完善而有较大优化空间[34] 用户反馈与迭代方向 - 在直播测试中,用户向开发团队提出了明确的改进建议,包括:授予对整台电脑的完全访问权限、更清晰地提示AI运行位置(本地/云端)、优化移动端体验、以及支持原生添加插件市场[29][30] - 开发团队表示将以用户反馈为核心快速迭代,几乎每天都上线新功能、修复bug、尝试新想法,并邀请用户共同参与产品打磨[11][15][30]