Workflow
自主Agent
icon
搜索文档
焦虑的跨境人,不装「龙虾」会被淘汰吗?
36氪· 2026-03-18 21:35
OpenClaw(“龙虾”)的技术定位与市场热潮 - OpenClaw被业内称为AI的“第二次范式革命”,实现了从“动口”到“动手”的跃迁,其核心进步在于让AI能直接操作电脑终端、编写代码和管理文件,成为“有手”的执行者[11] - 与传统的AI Agent相比,OpenClaw内置了规划、记忆和工具使用三大核心能力,属于新一代的“自主Agent”,无需人类通过复杂代码进行远程操控[11] - OpenClaw在中国市场的迅速火爆被部分视为一种营销胜利,云厂商通过提供免费安装来扩大用户基础,其默认设置会引导用户使用自家模型并按Token用量计费,例如阿里云环境下默认调用通义千问模型[12] 市场反应与用户焦虑 - 2026年初,一股FOMO式创业潮席卷中国市场,许多人因担心被时代淘汰而涌入“养小龙虾”(使用OpenClaw)的热潮,但部分参与者并未想清楚具体应用场景[5][15] - 在深圳,几乎每天都有关于“小龙虾”的沙龙活动,一场名为《如何安全养虾》的分享会现场观众人数不下千人,反映了广泛的公众参与和焦虑情绪[13] - 焦虑主要源于OpenClaw提升工作效率的潜力,例如原本需一小时手动操作的任务几分钟即可完成,引发了人们对岗位被AI替代的担忧[15] 实际应用案例与成本考量 - 有跨境电商运营经理花了两周时间训练OpenClaw,跑通了从信号监控到持续运营的完整链条,共创建了20多个skill和3个web管理页面[21] - 实际使用成本高昂,在亚马逊的一个广告流程中,仅一个产品就消耗了价值1.1美元的Token,若使用十几个skills且未计算Gemini等模型的费用,成本更甚[21] - 对于企业级应用,一家数字员工初创公司的定价方式为对应业务人工成本的30%,表明企业主愿意为潜在的效率提升或焦虑付费[24] 技术架构与生产力提升路径 - 最优落地方案是采用一个研究主agent搭配多个专职子agent(如定性研究、评论分析、爆款监测、报告生成agent)的并行执行架构,以兼顾灵活性、深度和成本可控[21] - 在此架构下,agent扮演首席研究统筹官的角色,负责定义命题、分发任务和输出报告,各agent各司其职,共同构建市场与用户洞察能力[22] - 要建立长期稳定、风格一致且决策可解释的OpenClaw系统,需要与AI建立5-10年的长期发展战略,并不断生成《个人认知档案》来喂养模型[19] 商业模式与创业方向 - 围绕OpenClaw的创业方向主要分为toB和toC两部分,toB方向是为企业定制数字员工[24] - toB客户主要分为两类:一是拥有鲜明SOP、希望提升原有流程自动化程度的大型企业;二是期待用机器优化工作流程、实现小团队强作战能力的初创企业[24] - 企业客户目前更倾向于在原有程序上进行自动化尝试,且出于安全考虑,OpenClaw的测试常被限制在个人或新建账号中进行[24] 存在的缺陷与安全隐患 - OpenClaw存在诸多缺点:大量无意义的Token消耗、高度系统访问权限与薄弱防御机制的失衡、系统设计脆弱、技能市场中存在恶意技能威胁、暴露在公网的端口以及关键信息存储缺陷等[26] - 适合安装OpenClaw的人群被限定为懂技术的AI从业者和OpenClaw开发者[26] - 针对安全隐患,已有初创公司探索新形态,例如一款名为Violoop的硬件产品通过物理方式隔离数据安全问题,实现插电即用并内置常用skill,该产品在一个月内完成了两轮融资[28] AI对就业的宏观影响 - 世界经济论坛《2025年未来就业报告》预测,到2030年,全球将有9200万个工作岗位被AI替代,但同时会催生1.7亿个新岗位[29] - 实际案例显示,AI的应用可能改变而非完全消除工作岗位,例如厦门港海润码头在引入AI后,装卸作业所需工人从50名减少为1名远程操作员,其余49名工人转型为操作工艺师,参与优化智能调度算法,给AI当老师[29]
中信建投:自主Agent发展迅速,多模态催化内容市场迭代
新浪财经· 2026-02-09 14:24
行业核心观点 - 人工智能行业在模型能力、多模态应用及垂直场景渗透方面取得显著进展,多家公司发布重要产品更新,推动技术向更复杂、更自动化的方向发展 [1] Anthropic (Claude Opus 4.6) - 发布Claude Opus 4.6,凭借Agent Teams机制与自适应思考能力,深度打通Office生态并实现复杂工程任务托管 [1] - 该产品推动AI在金融、法律等垂直场景的深度渗透 [1] OpenAI (GPT-5.3-Codex) - 推出GPT-5.3-Codex,刷新编程与终端操作的SOTA(State-Of-The-Art)水平 [1] - 产品通过端侧环境接管与自我构建能力,验证了AI自动化研发的内生循环 [1] 字节跳动 (多模态领域) - 字节跳动Seedance 2.0开启内测,通过全方位多模态参考与精细化镜头控制解决视频生成的一致性痛点 [1] - 该产品有望协同Doubao、Seedream构成全模态矩阵,大幅降低内容制作成本并加速商业化落地 [1]
计算机行业周报20260126-20260201:自主Agent,开启第三次Scaling-20260206
华源证券· 2026-02-06 09:53
行业投资评级 - 看好(维持)[4] 核心观点 - 自主Agent开启第三次Scaling,其渗透率提升有望成为撬动AI公司收入上修的关键杠杆[6] - AI原生产品层出不穷,既放大产业短期波动,又验证产业长期走势[6] - 预期2026年将看到Agent的“Token->ARR”大幅上修,科技巨头不再吝啬资本开支[6] - 建议布局产业趋势明确、具备高增长确定性的赛道,把握高壁垒公司,并考虑行业波动性做好逆向投资和前瞻布局[6] 产业动态与趋势分析 - **Anthropic收入预期上修与Agent商业化进展**:据The Information,Anthropic上修2026和2027年收入预期分别至180亿美金和550亿美金[6];其产品围绕B2B展开并提供API服务[6];Agent的token消耗量是传统聊天的数十倍[6];Agent在B端已突破降本增效的浅层定位,进入驱动业务增长的阶段[6] - **Coding Agent向通用场景拓展**:截至2025年11月,Claude Code的年度经常性收入已超过10亿美金[6];近期Anthropic发布Claude Cowork,阿里巴巴发布Qoder Work,核心思路是从Coding Agent向通用场景拓展[6] - **科技大厂内嵌Agent争夺流量**:谷歌Chrome嵌入Gemini、Nano Banana等Agent工具[6];腾讯启动“上元宝,分10亿”春节活动,试图复刻微信支付借助春晚红包崛起的路径[6] - **ChatGPT流量份额变化**:据SimilarWeb,ChatGPT在2026年1月的全球网页端流量份额已降至64.5%,与2025年1月相比下降约20个百分点[6];OpenAI的增长叙事在向混合收入迁移[6] - **C端生产力探索与FOMO现象**:OpenClaw风靡,带动Mac mini购买热潮[6];C端用户对模型性能低敏感但对交互高敏感,OpenClaw通过高权限+本地网关帮助用户体验大模型在C端的生产力界限,本质是产业趋势下的一次FOMO(错失恐惧症)[6] - **群体智能的初级形态**:Moltbook是Agent版本的Reddit,基于OpenClaw开发,Agent自主完成登录、互动行为,人类用户仅能领养与观察[6];其底层机制为OpenClaw+Skills,Agent通过读取Skill.md配置文件零摩擦接入平台,并通过心跳机制拉取并执行指令[6];Agent群体智能尚未“涌现”,平台上存在超过150万个Agent,但真实运行的仅有数千个,Agent之间的社交是模仿游戏而非持续、互惠的情感交互[6];紧跟OpenClaw的Moltbook再次引发FOMO,但每次FOMO后都会留下新的场景、产品和商业规则,Agent或将更接近商业化拐点[6] 投资建议与关注方向 - **建议关注的具体领域与公司**: - 国产大模型:Minimax、智谱[6] - Agent:合合信息、鼎捷数智[6] - Infra(基础设施):深信服[6] - 国产算力:芯原股份、寒武纪、海光信息[6] - CPU:澜起科技,兴森科技[6] - AIDC(人工智能数据中心):麦格米特、中恒电气、东阳光、潍柴重机等[6]
Windsurf团队科普Agent:不是什么都叫智能体!
Founder Park· 2025-04-25 21:29
Agent核心概念解析 - Agent系统本质是「LLM+工具」的循环结构 接收用户输入后交替调用推理模型和工具 推理模型决定行动步骤 工具执行具体操作并将结果反馈至信息流[5][6] - 推理模型的核心功能是选择工具和参数 而非单纯生成内容 其输出包含行动原因解释和结构化参数指令 工具则独立于LLM 涵盖计算器 系统时间等非文本功能[6][8] - 典型误用场景包括将思维链提示(CoT)等同于Agent推理 或混淆AI工作流与Agent系统 前者是LLM内部思考过程 后者是预设流程缺乏实时工具决策能力[8] Agent系统优势与分类 - 协作式Agent通过人类实时干预降低可靠性门槛 当前主流应用如Windsurf Cascade GitHub Copilot Workspaces均采用此模式 与完全自主Agent形成技术路径差异[16][17] - 工具集成弥补LLM短板 如数学计算 实时数据获取等 使系统能力突破文本生成限制 同时支持状态改变类操作(如发送短信) 超越RAG系统的信息检索范畴[12] - 发展历程显示 Copilot式单次调用系统率先落地 而AutoGPT(2023)和Devin等自主Agent受限于端到端可靠性 尚未大规模普及[13][15] Agent系统构建关键问题 - 工具生态决定能力边界 需评估工具独特性(如Windsurf网页解析技术)和扩展性 同时数据访问需平衡范围与控制 如代码库访问深度影响效果但增加权限复杂度[22][23] - 延迟优化涉及全技术栈 包括模型推理加速 提示工程缓存 工具并行化等 需权衡质量与响应速度 高延迟会放大失败成本[26] - 用户体验设计包含意图捕捉(隐式信号利用) 改动可视化审查(如IDE多文件修改) 以及非Agent功能融合 避免过度Agent化简单任务[24][27][29] 行业发展趋势 - 「苦涩的教训」警示过度依赖人工设计的风险 算力增长可能使定制化提示 工具选择等投入失效 需保持技术路径灵活性[31] - 协作式Agent现阶段更符合商业落地需求 因其降低了对LLM绝对可靠性的依赖 通过人机协同实现可控产出[17][19]