晚点独家丨火山引擎豆包大模型日均调用量破百万亿 Tokens,AI 云竞争日趋激烈
晚点LatePost·2026-03-25 11:28

文章核心观点 - AI模型调用量(Token消耗)的爆发式增长,特别是由智能体(Agent)应用驱动,正在重塑云计算行业的竞争格局,推动模型即服务(MaaS)业务从边缘走向中心,成为云厂商新的核心增长引擎和竞争焦点 [3][5][6][10][11][14] Token消耗的爆发式增长与行业格局 - 字节跳动火山引擎的豆包大模型日均调用量在春节后不到两个月内上涨超60%,已超过100万亿Tokens,使字节成为全球仅有的三家Token消耗量超100万亿的公司之一,与OpenAI、Google并列,其消耗主要来自中国市场 [3] - Token是AI处理文本、代码、图像、视频等任务的最小语义单元,其调用量是衡量AI模型活跃度和企业算力承载力的关键指标 [5] - 智能体(Agent)产品的流行显著推高了Token消耗,因为一次智能体任务包含多轮推理和工具调用,消耗远高于普通AI对话 [5] - 英伟达CEO黄仁勋将Token称为未来数字世界最核心、最值钱的大宗商品,其相关指标将成为全球企业CEO追踪的核心经营数据 [5] - 中国市场的Token消耗量增长惊人:从2024年初的日均1000亿,增长至2025年6月底的日均突破30万亿,一年半时间增长了300多倍 [11] MaaS(模型即服务)成为云战争新焦点 - 提供MaaS业务的云厂商是Token爆发的主要受益者,市场对Token需求的激增直接推高其模型调用量和收入 [6] - 自2025年起,围绕Token的AI云战争已经打响,各大云厂商积极布局 [6] - 亚马逊AWS管理层认为,长远看MaaS的收入贡献将与其核心的EC2计算实例业务(占总营收超30%)不相上下 [6] - 阿里云在2025年11月启动“百炼战役”,目标短期内将其MaaS平台Token调用规模提升三倍以上,并于2026年3月成立了由集团CEO直接带队的Alibaba Token Hub事业群 [6] - 阿里云目标是在2026年拿下中国AI云市场增量的80% [6] - 火山引擎曾定下2026年MaaS业务收入超百亿元的目标,并因业务增长迅猛已多次上调目标 [7] 云厂商的战略选择与竞争态势 - 在国内头部云厂商中,火山引擎对推进MaaS业务最为积极,将其置于很高的战略位置,甚至调整销售考核指标,将销售MaaS产品回报置于传统云服务之上 [8] - 对于在传统云服务上起步较晚的字节跳动,新兴的MaaS业务被视为实现弯道超车、并拉动IaaS、PaaS等底层服务增长的关键机会 [8] - 推广MaaS业务有助于大模型能力迭代,通过进入真实B端场景获得反馈,例如企业客户对长线程任务和智能体式编程(Agentic Coding)的需求,反向推动了模型能力的演进 [9] - 许多传统云厂商早期推进MaaS节奏较慢,部分原因是其原有收入和组织能力建立在CPU时代的传统云业务上,向以GPU为核心、产品形态不同的新需求转型需要时间 [10] - 早期中国MaaS市场规模很小,2024年仅为7.1亿元,而同年中国整体公有云服务市场规模超过3000亿元 [10] Agent(智能体)的崛起与市场影响 - 2025年5月,Anthropic推出的Claude Code等编程智能体产品流行,让AI进入工作流,从根本上改变了软件构建方式,并显著推高了Token消耗 [12] 1. Claude Code等产品带动了面向开发者的Coding Plan付费模式快速成型,将AI编程能力变为可高频使用的服务,加速了Agent普及 [12] - SemiAnalysis估算,Claude Code已完成GitHub上约4%的公开代码提交,预计到2026年底,这一比例可能超过20% [13] - 2025年底,OpenClaw将Agent带入更广泛的大众群体,应用场景从编程扩展到搜索、邮件处理、文档撰写等日常事务 [13] - 2026年初Agent风潮进入中国,带动AI创业公司相关业务:智谱将GLM Coding Plan价格上调至少30%;MiniMax在其财报中重点介绍Coding Plan模式,并于3月将其升级为全球首个支持全模态模型的统一Token Plan订阅计划 [13] - 国内类OpenClaw应用涌现后,火山引擎来自个人用户的Token消耗在过去一个多月增长了约16倍 [14] 市场扩容、挑战与未来方向 - Agent的普及和Token暴涨正在带动MaaS和整个AI云市场扩容 [14] - 对企业而言,通过公有云调用MaaS是使用大模型最实用有效的方式,能灵活按Token调用并承接模型快速迭代背后的部署与运维复杂度 [14] - 继亚马逊AWS、谷歌云释放涨价信号后,腾讯云、阿里云、百度智能云等主流云服务商在2026年初密集跟进涨价 [14] - Agent时代对云厂商提出新挑战,云平台需要从为Web、App场景服务转向围绕Agent设计 [14] - 下一代Agent应用需要具备三大核心能力:长期记忆、随业务数据变化的自我进化、准确执行多步骤复杂任务的能力 [15] - 行业共识是MaaS业务仍处于非常早期的阶段,竞争是一场艰难的“攻坚战”和“马拉松” [15]

晚点独家丨火山引擎豆包大模型日均调用量破百万亿 Tokens,AI 云竞争日趋激烈 - Reportify