自主Agent
搜索文档
中信建投:自主Agent发展迅速,多模态催化内容市场迭代
新浪财经· 2026-02-09 14:24
行业核心观点 - 人工智能行业在模型能力、多模态应用及垂直场景渗透方面取得显著进展,多家公司发布重要产品更新,推动技术向更复杂、更自动化的方向发展 [1] Anthropic (Claude Opus 4.6) - 发布Claude Opus 4.6,凭借Agent Teams机制与自适应思考能力,深度打通Office生态并实现复杂工程任务托管 [1] - 该产品推动AI在金融、法律等垂直场景的深度渗透 [1] OpenAI (GPT-5.3-Codex) - 推出GPT-5.3-Codex,刷新编程与终端操作的SOTA(State-Of-The-Art)水平 [1] - 产品通过端侧环境接管与自我构建能力,验证了AI自动化研发的内生循环 [1] 字节跳动 (多模态领域) - 字节跳动Seedance 2.0开启内测,通过全方位多模态参考与精细化镜头控制解决视频生成的一致性痛点 [1] - 该产品有望协同Doubao、Seedream构成全模态矩阵,大幅降低内容制作成本并加速商业化落地 [1]
计算机行业周报20260126-20260201:自主Agent,开启第三次Scaling-20260206
华源证券· 2026-02-06 09:53
行业投资评级 - 看好(维持)[4] 核心观点 - 自主Agent开启第三次Scaling,其渗透率提升有望成为撬动AI公司收入上修的关键杠杆[6] - AI原生产品层出不穷,既放大产业短期波动,又验证产业长期走势[6] - 预期2026年将看到Agent的“Token->ARR”大幅上修,科技巨头不再吝啬资本开支[6] - 建议布局产业趋势明确、具备高增长确定性的赛道,把握高壁垒公司,并考虑行业波动性做好逆向投资和前瞻布局[6] 产业动态与趋势分析 - **Anthropic收入预期上修与Agent商业化进展**:据The Information,Anthropic上修2026和2027年收入预期分别至180亿美金和550亿美金[6];其产品围绕B2B展开并提供API服务[6];Agent的token消耗量是传统聊天的数十倍[6];Agent在B端已突破降本增效的浅层定位,进入驱动业务增长的阶段[6] - **Coding Agent向通用场景拓展**:截至2025年11月,Claude Code的年度经常性收入已超过10亿美金[6];近期Anthropic发布Claude Cowork,阿里巴巴发布Qoder Work,核心思路是从Coding Agent向通用场景拓展[6] - **科技大厂内嵌Agent争夺流量**:谷歌Chrome嵌入Gemini、Nano Banana等Agent工具[6];腾讯启动“上元宝,分10亿”春节活动,试图复刻微信支付借助春晚红包崛起的路径[6] - **ChatGPT流量份额变化**:据SimilarWeb,ChatGPT在2026年1月的全球网页端流量份额已降至64.5%,与2025年1月相比下降约20个百分点[6];OpenAI的增长叙事在向混合收入迁移[6] - **C端生产力探索与FOMO现象**:OpenClaw风靡,带动Mac mini购买热潮[6];C端用户对模型性能低敏感但对交互高敏感,OpenClaw通过高权限+本地网关帮助用户体验大模型在C端的生产力界限,本质是产业趋势下的一次FOMO(错失恐惧症)[6] - **群体智能的初级形态**:Moltbook是Agent版本的Reddit,基于OpenClaw开发,Agent自主完成登录、互动行为,人类用户仅能领养与观察[6];其底层机制为OpenClaw+Skills,Agent通过读取Skill.md配置文件零摩擦接入平台,并通过心跳机制拉取并执行指令[6];Agent群体智能尚未“涌现”,平台上存在超过150万个Agent,但真实运行的仅有数千个,Agent之间的社交是模仿游戏而非持续、互惠的情感交互[6];紧跟OpenClaw的Moltbook再次引发FOMO,但每次FOMO后都会留下新的场景、产品和商业规则,Agent或将更接近商业化拐点[6] 投资建议与关注方向 - **建议关注的具体领域与公司**: - 国产大模型:Minimax、智谱[6] - Agent:合合信息、鼎捷数智[6] - Infra(基础设施):深信服[6] - 国产算力:芯原股份、寒武纪、海光信息[6] - CPU:澜起科技,兴森科技[6] - AIDC(人工智能数据中心):麦格米特、中恒电气、东阳光、潍柴重机等[6]
Windsurf团队科普Agent:不是什么都叫智能体!
Founder Park· 2025-04-25 21:29
Agent核心概念解析 - Agent系统本质是「LLM+工具」的循环结构 接收用户输入后交替调用推理模型和工具 推理模型决定行动步骤 工具执行具体操作并将结果反馈至信息流[5][6] - 推理模型的核心功能是选择工具和参数 而非单纯生成内容 其输出包含行动原因解释和结构化参数指令 工具则独立于LLM 涵盖计算器 系统时间等非文本功能[6][8] - 典型误用场景包括将思维链提示(CoT)等同于Agent推理 或混淆AI工作流与Agent系统 前者是LLM内部思考过程 后者是预设流程缺乏实时工具决策能力[8] Agent系统优势与分类 - 协作式Agent通过人类实时干预降低可靠性门槛 当前主流应用如Windsurf Cascade GitHub Copilot Workspaces均采用此模式 与完全自主Agent形成技术路径差异[16][17] - 工具集成弥补LLM短板 如数学计算 实时数据获取等 使系统能力突破文本生成限制 同时支持状态改变类操作(如发送短信) 超越RAG系统的信息检索范畴[12] - 发展历程显示 Copilot式单次调用系统率先落地 而AutoGPT(2023)和Devin等自主Agent受限于端到端可靠性 尚未大规模普及[13][15] Agent系统构建关键问题 - 工具生态决定能力边界 需评估工具独特性(如Windsurf网页解析技术)和扩展性 同时数据访问需平衡范围与控制 如代码库访问深度影响效果但增加权限复杂度[22][23] - 延迟优化涉及全技术栈 包括模型推理加速 提示工程缓存 工具并行化等 需权衡质量与响应速度 高延迟会放大失败成本[26] - 用户体验设计包含意图捕捉(隐式信号利用) 改动可视化审查(如IDE多文件修改) 以及非Agent功能融合 避免过度Agent化简单任务[24][27][29] 行业发展趋势 - 「苦涩的教训」警示过度依赖人工设计的风险 算力增长可能使定制化提示 工具选择等投入失效 需保持技术路径灵活性[31] - 协作式Agent现阶段更符合商业落地需求 因其降低了对LLM绝对可靠性的依赖 通过人机协同实现可控产出[17][19]