Token Consumption - 财报，业绩电话会，研报，新闻

Token Consumption

搜索文档

小熊跑的快· 2026-05-09 08:00

Agent当前市场体量与份额 - 截至最新数据，Agent相关的Token消耗量约占全球大型语言模型总消耗量的30% [2] - 目前消费级对话应用仍占据约60%以上的流量，但Agent的增长速度是普通对话的4.5倍 [3] Agent未来增长预测 - 高盛预测到2030年，Agent将反超对话，占据总Token消耗的70%以上 [4] - IDC预测全球活跃AI Agent的数量将从2025年的约2，860万个激增至2030年的22.16亿个，增长近80倍 [10] - 到2027年，企业级Agent的使用量将增长10倍，企业运行的Agent数量将从普遍的2-5个增加至20-50个以上 [10] - 预计到2030年，Agent每年执行的任务数将从440亿个飙升至415万亿个，年复合增长率高达524% [10] - 根据MarketsandMarkets的数据，AI Agent市场规模预计从2025年的约78亿美元增长到2030年的526亿美元，年复合增长率约为46.3% [10] Agent的Token消耗特征与密度 - Agent的Token密度远高于普通对话，完成同一目标，其消耗量远超人工对话 [5] - 标准对话单次任务消耗约1，000个Token，内嵌Copilot消耗5，000+个Token，而自主Agent消耗可达100，000+个Token [5] - 微软研究院数据显示，Agent任务的开销通常是普通代码聊天或推理任务的1，000倍 [5] - 在Agent协作中，输入Token占大头，约为54%-60%，一项针对软件工程Agent的调查显示，53.9%的Token消耗来自于输入 [5] - 在代码评审等任务中，为修正一个Bug反复调用模型，单此阶段的Token消耗就占整个开发任务的59.4% [6] 驱动Agent增长与消耗的技术因素 - 从“人机对话”到“机机对话”的转变，一个编排器同时调度5-10个子Agent，这种指数级调用拉高了Token占比 [8] - 2026年MCP协议的全面普及将极大降低Agent调用外部工具的门槛，导致单次自动化任务的Token吞吐量暴增 [8] - 2026年后大模型走向强化学习路径，Agent在输出每个Token前会进行大量复杂的逻辑判断，这增加了对CPU核数的需求 [8] - 许多Agent的决策链是高度串行的，需要CPU具备极高的单核频率以降低任务延迟 [9] 细分领域增长与行业渗透 - 垂直领域Agent（如医疗、法律、金融）增速最快，预计2025-2030年间的年复合增长率高达62.7% [10] - 软件开发Agent预计年复合增长率为52.4% [11] - Gartner预测，到2030年，60%的供应链管理软件企业将采用Agentic AI功能，而2025年这一比例不足5% [12] 对计算硬件（CPU）的需求影响 - Agent数量的巨大增长将直接驱动对CPU核心数的需求，若按CPU核数与Agent任务数1:1的配比，核心数也需相应增长约80倍 [12] - CPU单代产品核心数提升通常在25%-50%之间 [13][14] - 以AMD EPYC处理器为例，核心数已从9004系列的96核推进至128核甚至192核 [15] - 若按每代核心数提升35%计算，从2026年至2030年经过三次代际提升，所需CPU颗数的年化增长率可能高达147% [15]