Workflow
A2A
icon
搜索文档
人工智能行业专题(12):AIAgent开发平台、模型、应用现状与发展趋势
国信证券· 2025-09-10 23:25
投资评级 - 行业投资评级为优于大市(维持)[1] 核心观点 - AI Agent是突破指令执行的智能实体 具备代理权 可主动感知 自主决策并执行复杂任务 在AGI分级中处于L3智能体阶段 性能等效90%熟练成年人[3] - AI背景下AI基础设施层面临重构 客户将重新选择云/AI平台 云厂商加大布局AI/Agent平台瓜分新市场[3] - 海外模型呈现差异化发展 国内模型层并未拉开显著差异 2025年初深度推理与长上下文模型发布推动Tokens调用量快速提升[3] - 应用C端重磅搜索产品依赖模型能力与生态导流 图像与编程类产品发展迅猛 应用越偏向垂类则技术门槛越低 产品理解要求越高 竞争越激烈 商业化闭环越容易[3] - 应用B端Copilot/Agent产品形态丰富 持续渗透 机遇与挑战并存 企业落地仍面临幻觉 数据安全 成本高等问题[3] - 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5% CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元(CAGR 44.9%)[3] Agent定义、技术与发展 - AI Agent具备自主性 规划力与执行力 核心突破在于赋予代理权 可主动感知环境 自主规划决策 执行复杂任务[10] - 关键特性包括自主决策 动态学习 跨系统协作 核心模块包括感知层 记忆层 决策层 执行层[10] - 与LLM和传统自动化的关键区别在于LLM是知识顾问 Agent是战略指挥官 传统自动化仅规则执行 Agent实现端到端任务闭环[10] - 在AGI分级中 Agent处于L3智能体阶段 性能等效90%熟练成年人[11] - 代理核心构成包括记忆 感知 规划 工具使用[12][15] - 相关技术创新包括MCP(模型上下文协议)和A2A(Agent-to-Agent通信协议)[16][19] - Agent市场图谱分为基础设施类 横向职能类 垂直应用类三大类别[20][22] Agent开发平台的布局 - 海外云厂商平台布局对比:微软聚焦B端基础设施 模型支持最全面 工具链和生态整合全面 安全与稳定性强 谷歌兼顾B/C端多场景 多模态强但生态不成熟 市占率较低 亚马逊依托AWS服务中小企业 侧重算力销售与便捷部署但工具链分散[51] - 国内平台布局对比:字节扣子覆盖全场景 开发者与智能体数量领先 阿里百炼主攻B端全行业 服务30余万企业客户 MCP工具链和开源生态丰富 腾讯元器基于混元大模型 主打轻量化低代码开发 聚焦社交与游戏垂类[55] - 微软Azure AI Foundry已被80%财富500强企业使用 25Q2处理tokens超500万亿 同比增长超7倍 agent service客户数达1.4万[42] - 谷歌AI平台架构涵盖数据综合层 控制层 数据层 业务活动层 赋能基础设施包括TPU v7 Ironwood和英伟达支持[48][49] - PaaS/Agent平台面临市场份额重构机会 IDC调查显示70%受访企业将更换或新增云/AI平台供应商[56] - 平台关键需求包括提高开发交付效率 AI驱动的工作流自动化是首要需求 安全与隐私是最大落地障碍[62][63] - 企业AI战略重心分层 核心模型能力是第一抓手 云服务商在助力实现AI目标的供应商中占比49%[68][70] 模型层与Tokens调用量分析 - 根据Openrouter数据 谷歌Gemini与Anthropic Claude占API市场半壁江山 国内DeepSeek 阿里Qwen系列份额稳步提升[3][95] - 谷歌2025年7月调用量980万亿tokens 较去年增长100倍 其中内部需求占比高达97%[3] - 国内字节豆包2025年5月日均tokens 16.4万亿 增长137倍 内部占比超80%[3] - 海外模型差异化发展:OpenAI技术路径领先 聚焦推理与专业能力 谷歌端到端原生多模态领先 Anthropic编程场景领先 实用性突出[102][103] - 国内模型未拉开显著差距:DeepSeek技术研究领先 阿里自研能力与综合能力强 字节各模态均衡 百度中文场景优化 腾讯基于DeepSeek改造[105][106] - 分场景份额:编程场景Claude Sonnet4占近半调用量 角色扮演场景DeepSeekV3领先 科技金融场景Claude Sonnet4与Gemini Flash占优 营销搜索翻译场景Gemini Flash优势明显[108][111][113] - 过去半年模型周tokens消耗量增长4.7倍 深度推理与长上下文模型发布推动调用量快速提升[122][123] C端与B端Agent进展 - 应用C端重磅搜索产品依赖模型能力与生态导流 ChatGPT MAU预计年底超10亿 Gemini MAU 4.5亿 国内夸克 元宝依托生态导流[3] - 图像类Midjourney ARR 5亿美元 可灵月收入1.5亿元 编程类Cursor ARR 5亿美元 GitHub Copilot Web MAU 1.2亿[3] - 应用B端Copilot/Agent产品形态丰富 持续渗透 微软Copilot家族月活用户已超1亿 但企业落地面临幻觉 数据安全 成本高(Agent调用成本为LLM 15倍)等问题[3] - 根据CBINSIGHTS 企业工作流 编码两大领域2024年营收均超10亿美元 微软Microsoft Copilot 2024年收入约8亿美元 GitHub Copilot收入约6亿美元 总占整体市场超25%份额[25] - 垂类市场中客户服务 软件开发为高潜力赛道 64家组织中2/3计划12个月内用AI代理支持客服[25] Agent的市场空间与发展预期 - 根据IDC数据 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5%[3] - CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元 CAGR 44.9%[3] - 根据Garnter与IDC 短期(2023-2025)GenAI嵌入现有应用 中期(2025-2027)Agent成核心组件 长期(2027+)自主代理网络主导业务 2035年后Agent将成为认知共生的人类助手 智能体即应用将成主流[3]
AI智能体,是不是可以慢一点? | ToB产业观察
钛媒体APP· 2025-05-06 13:42
大模型应用套壳争议 - Manus采用第三方大模型进行工程化包装实现通用AI智能体能力 被业内质疑为"极致套壳" 但创始团队认为这是成功策略 [2] - 行业普遍以自研基础大模型为荣 DeepSeek OpenAI等头部企业聚焦底层技术研发 形成赢者通吃格局 [2] - 金沙江创投朱啸虎直言"所有AI应用都是套壳应用 所谓壁垒是忽悠人的" 反映行业对应用层技术价值的争议 [2] 市场融资与估值动态 - Manus背后公司"蝴蝶效应"获Benchmark领投7500万美元融资 估值飙升至5亿美元 [2] - 融资事件显示资本市场对AI智能体赛道的认可 尽管存在技术争议 [2] 大厂AI智能体布局 - 字节组建至少5个团队开发不同AI智能体产品 推出"扣子空间"协作平台 提供股票分析和行研分析两类专业Agent [4] - 百度95后团队30天研发对标Manus的"心响"APP 涵盖超200个任务类型 包括专业咨询和日常规划 [4] - 阿里与Manus战略合作 基于通义千问开源模型实现功能复制 并推出"心流"智能体开启公测 [5] 技术生态构建 - 阿里云 腾讯云 蚂蚁集团 百度等大厂相继拥抱MCP机制 推动智能体间通信和资源连接 [6] - 民生证券预测MCP协议+Agentic-based决策路径将成为主流范式 大厂通过协议引入生态伙伴推动产业发展 [6] 安全风险与治理挑战 - AI智能体自主决策特性带来更高安全风险 包括幻觉问题 提示注入攻击 数据泄露等隐患 [7] - 多智能体协作导致访问控制漏洞 资源竞争冲突等问题 安全管理复杂度指数级上升 [8] - 70%以上企业客户对AI智能体认知不足 行业缺乏专职安全团队 产品安全性能存疑 [7][8] 技术本质与发展趋势 - AI智能体需解决感知 理解 规划 执行等多环节协同 技术架构复杂度远超传统系统 [11] - 微软预测未来将出现专业智能体集群 通过通信协作完成任务 Anthropic和谷歌分别推出MCP A2A协议提升搭建效率 [10] - 行业需从被动执行转向主动进化 如自动驾驶系统对传统技术模块的AI化改造 [11]
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 22:10
Agent定义与核心特征 - Agent是基于环境反馈使用工具的程序 采用Anthropic的定义[2] - 核心三要素包括状态(Context)、行动(Tool Use)、激励信号(RL反馈机制)[32][33] - 与RL强关联 需理解强化学习才能设计优质Agent产品[31] Agent技术演进 - 2023年4月AutoGPT为代表的早期Agent更像玩具 实际应用价值有限[4] - 当前Agent已能在工作生活场景中真正解决问题 实现价值跃迁[5] - 进步源于:1)底层模型能力提升(如RL结合、长思维) 2)工程产品突破(Context构建)[6][7] Context工程创新 - Context是大模型执行任务所需信息总和 不同产品Context构成不同[8] - 相比传统RAG Agent能自动化提炼Context 减少人工干预[10][11] - 优质Context需包含用户历史行为路径 如APP打开瞬间即提供海量意图线索[48][49] Tool Use技术方案 - Function Call/MCP/A2A属于代码驱动派 Computer Use/Browser Use属于视觉模拟派[13] - MCP核心价值在于统一Tool Use标准 降低工具调用门槛[12] - Browser Use存在纯视觉方案(如已倒闭的Adept)和API包装方案 后者更成熟稳定[15] 产品设计方法论 - Chat是最佳交互入口 保障用户自由度优于追求准确度[41] - 需解决双重信任问题:开发者信任模型能力 用户信任执行过程[52][54] - 垂直领域Agent将长期主导 通用Agent面临收敛困难[25][46] 行业竞争格局 - 当前Agent可分为:1)Coding Agent(交付代码) 2)调研Agent(交付报告) 3)表格Agent(定量分析)[61][64] - Sheet0实现100%准确率 核心在于模块化工具复用与AI Coding验证[57][67] - AI Coding与Agent存在协同效应 但直接编码执行任务成本过高[29][30] 发展关键变量 - 模型能力突破与Context工程进步是两大核心驱动因素[69][70] - 需构建完整评估体系(激励信号) 确保系统可收敛[35][71] - 产品需平衡通用性与准确性 不同场景选择不同技术路径[59][60]