Token - 财报，业绩电话会，研报，新闻

Token

搜索文档

2月井喷！中国AI调用量首超美国，四款大模型霸榜全球前五，国产算力需求正经历指数级增长

每日经济新闻· 2026-02-26 19:35

全球AI模型调用量格局剧变 - 2026年2月9日至15日当周，中国AI模型的Token调用量达到4.12万亿，首次超过同期美国模型的2.94万亿，实现历史性赶超[8][9] - 次周（2月16日至22日），中国模型调用量进一步冲高至5.16万亿Token，三周内增长127%，而同期美国模型调用量降至2.7万亿Token[2][9] - 全球最大的AI模型API聚合平台OpenRouter数据显示，其前十大模型的周调用量从2025年3月初的1.24万亿Token飙升至2026年2月中旬的13.95万亿Token，不到一年增长超过10倍[8] 中国模型集群式崛起与市场主导 - 在2026年2月16日至22日的周榜单中，全球调用量排名前五的模型中有四款来自中国，分别为MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5以及DeepSeek的V3.2，这四款模型合计贡献了Top5总调用量的85.7%[12] - 中国模型的增长动能并非依赖单一产品，而是厂商集群式崛起[2][9] - 在OpenRouter平台用户以海外开发者为主（美国占47.17%，中国仅占6.01%）的背景下，此数据客观反映了中国AI模型在全球范围内的真实吸引力[5] 领先模型表现与市场格局 - MiniMax的M2.5模型于2026年2月13日发布，上线不足一周便登顶周调用量榜首，在2月9日至15日当周平台总调用量激增的3.21万亿Token中，仅M2.5一款模型就贡献了1.44万亿Token增量[12] - 月之暗面的Kimi K2.5模型能调度多达100个“Agent分身”并行工作，将复杂任务处理效率提升3到10倍，发布后不到一个月的累计收入已超过其2025年全年总收入[15] - 根据a16z与OpenRouter的联合报告，过去一年DeepSeek全系列模型总Token调用量以14.37万亿位居全球第一，阿里千问全系列以5.59万亿位居第二[15] - 在中国大模型B端市场，2025年下半年千问（Qwen）系列模型的日均Token调用量占比为32.1%，位列第一，相比上半年（17.7%）几乎翻倍[16] 显著的成本竞争优势 - 中国模型具备极强的成本优势，以OpenRouter平台价格为例，在输入环节，MiniMax M2.5与智谱GLM-5的价格均为0.3美元/百万Token，而海外对标产品Claude Opus4.6为5美元/百万Token，是前者的约16.7倍[18] - 在输出环节，成本差异更为悬殊：MiniMax M2.5为1.1美元/百万Token，智谱GLM-5为2.55美元/百万Token，而Claude Opus4.6高达25美元/百万Token，分别是前两者的约22.7倍和9.8倍[18] - 中国模型在多个基准测试中表现比肩甚至超越国际顶尖模型，如MiniMax M2.5在SWE-Bench Verified测试中得分为0.802，与Claude Opus4.6的0.808相近[19] 技术架构创新驱动降本增效 - 以“混合专家”（MoE）架构为代表的技术路线是中国模型能够大幅降低推理成本的核心原因之一，DeepSeek、阿里巴巴的通义千问3.5-Plus等模型已广泛采用该架构[20] - MoE架构通过“按需激活”专家网络，相较于传统稠密模型，能极大减少计算量和硬件资源需求，数据显示采用MoE架构可直接让推理时显存占用降低60%，推理吞吐量提升高达19倍[20] - 中国AI厂商积极探索“垂直整合”路径，将模型算法、云计算基础设施和AI芯片进行深度一体化协同设计与优化，以极致算力调度算法实现硬件资源最高效利用，进一步降低基础设施成本[21] Token消耗增长驱动与商业模式演进 - 摩根大通预测，从2025年到2030年，中国Token消耗量的年复合增长率将达到惊人的330%，在5年间实现370倍的增长[21] - AI角色正从“问答工具”进化为“生产力工具”，用户核心需求从浅层“问答”转向深度“干活”，导致“Token通胀”，即单位用户Token消耗结构性上升[22] - AI Agent技术的兴起和普及，以及推理强度的上升，进一步放大了Token的消耗[22] - AI服务商业模式正从“按量计费”向“燃料+成果”混合模式演进，未来定价将走向高度定制化和灵活化，形成多维度、动态的定价体系[23][24] 产业生态与全球影响 - 产业市场形成由多家头部企业构成的“AI中国团”宽广技术产业群落，有利于竞争创新和人才生态建设，并在中美AI竞争中形成集群优势[17] - 知名风投机构a16z的合伙人观察到，在硅谷寻求融资的AI初创公司中，其路演核心模型高达80%使用中国的开源模型[17] - Token正从互联网“流量”转变为AI时代执行生产任务必不可少的“燃料”，推理性能直接决定客户的收入能力[23]