Workflow
Token Consumption
icon
搜索文档
cpu深度系列(2):agent目前的token消耗量
小熊跑的快· 2026-05-09 08:00
Agent当前市场体量与份额 - 截至最新数据,Agent相关的Token消耗量约占全球大型语言模型总消耗量的30% [2] - 目前消费级对话应用仍占据约60%以上的流量,但Agent的增长速度是普通对话的4.5倍 [3] Agent未来增长预测 - 高盛预测到2030年,Agent将反超对话,占据总Token消耗的70%以上 [4] - IDC预测全球活跃AI Agent的数量将从2025年的约2,860万个激增至2030年的22.16亿个,增长近80倍 [10] - 到2027年,企业级Agent的使用量将增长10倍,企业运行的Agent数量将从普遍的2-5个增加至20-50个以上 [10] - 预计到2030年,Agent每年执行的任务数将从440亿个飙升至415万亿个,年复合增长率高达524% [10] - 根据MarketsandMarkets的数据,AI Agent市场规模预计从2025年的约78亿美元增长到2030年的526亿美元,年复合增长率约为46.3% [10] Agent的Token消耗特征与密度 - Agent的Token密度远高于普通对话,完成同一目标,其消耗量远超人工对话 [5] - 标准对话单次任务消耗约1,000个Token,内嵌Copilot消耗5,000+个Token,而自主Agent消耗可达100,000+个Token [5] - 微软研究院数据显示,Agent任务的开销通常是普通代码聊天或推理任务的1,000倍 [5] - 在Agent协作中,输入Token占大头,约为54%-60%,一项针对软件工程Agent的调查显示,53.9%的Token消耗来自于输入 [5] - 在代码评审等任务中,为修正一个Bug反复调用模型,单此阶段的Token消耗就占整个开发任务的59.4% [6] 驱动Agent增长与消耗的技术因素 - 从“人机对话”到“机机对话”的转变,一个编排器同时调度5-10个子Agent,这种指数级调用拉高了Token占比 [8] - 2026年MCP协议的全面普及将极大降低Agent调用外部工具的门槛,导致单次自动化任务的Token吞吐量暴增 [8] - 2026年后大模型走向强化学习路径,Agent在输出每个Token前会进行大量复杂的逻辑判断,这增加了对CPU核数的需求 [8] - 许多Agent的决策链是高度串行的,需要CPU具备极高的单核频率以降低任务延迟 [9] 细分领域增长与行业渗透 - 垂直领域Agent(如医疗、法律、金融)增速最快,预计2025-2030年间的年复合增长率高达62.7% [10] - 软件开发Agent预计年复合增长率为52.4% [11] - Gartner预测,到2030年,60%的供应链管理软件企业将采用Agentic AI功能,而2025年这一比例不足5% [12] 对计算硬件(CPU)的需求影响 - Agent数量的巨大增长将直接驱动对CPU核心数的需求,若按CPU核数与Agent任务数1:1的配比,核心数也需相应增长约80倍 [12] - CPU单代产品核心数提升通常在25%-50%之间 [13][14] - 以AMD EPYC处理器为例,核心数已从9004系列的96核推进至128核甚至192核 [15] - 若按每代核心数提升35%计算,从2026年至2030年经过三次代际提升,所需CPU颗数的年化增长率可能高达147% [15]