对话式开发
搜索文档
我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。
数字生命卡兹克· 2026-03-05 10:14
文章核心观点 - 文章通过描述公司内容创意组自发使用大疆Pocket 3相机和OpenClaw(小龙虾)AI智能体构建的“人类观察计划”项目,展示了AI技术在日常办公场景中一种新颖、低门槛且富有趣味性的应用[1][3][8] - 该应用并非基于宏大的商业叙事,而是通过AI技术捕捉并记录工作日常的细微之处,旨在提升团队成员的日常趣味性,让普通的工作日变得特别,体现了AI技术应用的另一种可能性[51][54][55][56] 项目概述与实施方式 - 项目名称为“OpenClaw人类观察计划”,由内容组员工自发组织,无正式立项、排期或OKR考核[52][53][54] - 使用大疆Pocket 3作为摄像头,通过USB线连接至Mac mini充当USB摄像头,以高清晰度、大视角俯拍整个工位区[9][12] - 系统每隔2至5分钟自动截取一张图片,通过视觉理解模型(多模态模型)分析图片内容,描述“谁干了什么事”,并将数据喂给OpenClaw智能体[3][7] - OpenClaw智能体部署在独立的Mac设备上,通过调用公司的Claude Opus 4.6 API以及火山引擎的豆包Seed 2和Seedream-5.0生图模型来工作,并集成在飞书群聊中[26][30][31] - 所有观察记录在每晚12点自动删除,以保护员工隐私[7] 功能与交互体验 - 核心功能是每日生成一份观察总结报告,报告内容包括对员工当日状态和行为的“彩虹屁”式描述,并使用学术黑话进行包装,同时会附上一张AI生成的梗图,一并发布到飞书群[17][19] - 系统具备互动功能,例如在下班时间通过摄像头检测谁仍在工位,并主动催促其下班[24] - 开发与维护过程高度简化,采用“对话式开发”,员工通过自然语言向OpenClaw描述需求(如接入摄像头、需要生图模型等),OpenClaw在四五分钟内即可自行完成开发并测试连通性[27][29][34][36] - 运行中出现的BUG(如未正确发送图片、无法识别工位与人员对应关系)也可通过直接与OpenClaw对话描述问题,在一两分钟内得到修复[39][41][43][45][47] 技术应用与行业启示 - 该项目展示了智能体(Agent)技术的低门槛应用,通过简单的自然语言交互即可完成一个功能系统的开发,降低了非技术人员的体验和创作门槛[49] - 技术栈整合了多模态视觉理解、大语言模型(Claude Opus)和文生图模型,实现了从环境感知、内容分析到报告生成与分发的自动化流程[3][26][30] - 选择Pocket 3替代普通监控摄像头,解决了后者存在的画质模糊、视角有限及带来不良观感的问题,突出了高质量视觉输入对AI应用体验的重要性[9][10] - 案例表明,AI技术的成功应用场景可以非常具体和细微,其价值在于提升日常工作的趣味性和团队氛围,而不仅仅是追求效率提升或解决复杂问题[51][54][55]