API 聚合平台 - 财报，业绩电话会，研报，新闻

API 聚合平台

搜索文档

2026-03-04 22:17

行业与公司 * **行业**: AI大模型、Token出海、API聚合平台、算力与电力基础设施 [1] * **涉及公司/模型**: * **国内模型/厂商**: 智谱（智谱清言）、Minimax、月之暗面、Kimi、DeepSeek、支付宝 [14][24][27] * **海外模型/厂商**: OpenAI、Claude、Mistral、K、W、D [3][5][14][16] * **聚合平台**: OpenRouter、ai.cc、Together.ai、Pax and AI、POE、Portkey [1][6][13][14] * **云平台/大厂**: 微软、Google、AWS、字节、阿里 [2][6][14][20] 核心观点与论据 **1. Token出海商业模式与产业链** * 商业模式形成“激活平台—模型厂商—算力提供方”三方联动，激活平台作为流量聚合与统一入口，按“每100万token”向用户收费，再与后端模型和算力方分成 [1][2] * 算力侧需与国内电力网络运营商完成基础成本结算 [2] **2. 市场现状与增长驱动** * 2026年一季度，以OpenRouter为代表的独立API聚合平台进入爆发期，全行业日均Token输出规模预计超50万亿，年增速达400% [1] * 2026年全国Token日均消耗量预计达700-800万亿；2027年受Agent化（消耗量提升7-8倍）及全模态演进驱动，日均消耗有望增长5倍至3,500-4,000万亿 [1][20] * 增长核心驱动：供给侧国内模型能力提升（如智谱清言排名进入全球前六），需求侧开发者采用“前置+交叉验证”策略以降本，带动聚合平台调用量上升 [14] **3. 定价与成本结构** * **显著价差**: 国内大模型凭借1/8至1/10的显著价格优势出海，海外模型（如OpenAI、Claude）价格约十几到二十美元/百万token，国内模型最低约0.8美元/百万token [1][3][16] * **成本构成**: Token生成成本中电力（35%-45%）与算力折旧（25%-35%）为核心，其次为带宽（10%-15%）和运维人力成本（15%-20%） [1][17] * **定价策略**: 聚合平台定价较官方价更便宜，机制包括按输入/输出分别定价（输出单价是输入的4~6倍）、按“命中率”定价（缓存命中后价格低约20%~30%）、提供预留容量/承诺量优惠（如承诺月消费1万亿tokens可获7折） [15] **4. 国内模型的竞争优势与不足** * **优势**: * **价格与效率**: 极致稀疏激活（如4%激活率）实现推理效率领先，首Token生成速度快于海外20% [1][18] * **多语种能力**: 语种覆盖超过200种，在东南亚等小语种（泰语、越南语、印尼语等）上能力与性价比更突出 [1][16][18] * **架构灵活**: 可同时使用英伟达与国产硬件方案 [18] * **不足/风险**: 技术路径迭代可能滞后，若海外快速对齐全模态能力而国内停留于语言模型阶段，将面临代差风险 [23] **5. 出海路径与客户画像** * **主要路径**: 1) 模型部署到海外云平台（微软、Google等）；2) 在AWS等云平台部署；3) 通过激活平台在海外获客并聚合流量。当前主流流量仍在云平台，激活平台合计约占市场10% [6] * **更可能使用中国本土算力与电力的路径**: 聚合/激活平台链路，即海外获客、国内提供推理算力与电力支撑的模式 [7] * **客户画像**: * **B端/开发者**: 中小企业与开发者偏好通过OpenRouter等聚合平台接入，以获得折扣和灵活切换模型的能力 [9] * **C端用户**: 通过云上按量付费（pay as you go），典型做法是先预充值（如按“每100万token”充值），后端调用聚合平台的token支撑前端服务 [12] * **OpenRouter核心用户**: 自由开发者/小团队、具备C端流量的编程工具类产品、海外中小企业 [24] **6. 合规、延迟与基础设施要求** * **合规**: 低风险场景（如日常对话）可由国内算力服务海外；中高风险场景（如法律、编程）需满足本地合规，将数据与推理部署在海外合规站点 [10] * **延迟与布局**: 海外用户请求回源中国本土推理延迟约100毫秒，绕行国际光缆可能达200-500毫秒。为改善体验（需压至300毫秒以下），算力出海需配合边缘计算节点 [3][18] * **海外部署成本**: 若在海外（如新加坡）部署站点调用，定价约为海外头部模型的1/4，但相较国内部署价格上浮约2倍，主因合规成本、当地电价及更高带宽成本 [19] **7. 竞争格局与市场份额** * 市场玩家分三类：1) 独立聚合平台（如OpenRouter、ai.cc），合计占市场约30%；2) 大厂自有平台（AWS、Google、微软等），占约60%；3) 垂直平台（Pax and AI等） [13] * 在独立聚合平台内部，OpenRouter市占率约40%-50%，服务开发者规模超500万，年增速约400%；ai.cc市占率约15% [13][14] **8. 产业机会与风险** * **机会**: Token出海带动中国算力与电力配套输出，市场可覆盖东南亚、日韩、中东、欧洲等区域，边缘计算服务成为重要配套基础设施 [21][22] * **风险**: 1) 地缘政治不确定性；2) 硬件/电力成本波动；3) 海外头部平台的生态封锁；4) 全模态技术路径迭代滞后导致的代差风险 [3][23] 其他重要信息 **1. 交易体量与占比** * 2026年一季度，OpenRouter平台日均token输出规模预计超50万亿，年度口径约1,800万亿 [8] * 2025年官网披露日均token消耗量为30万亿，全年约10.95千万亿 [19] * 2026年2月底，中国企业在OpenRouter上月度量约22万亿，占该平台总量约60% [25] **2. 开发者降本策略** * 采用“前置+交叉验证”策略：先用高性价比国内模型（如智谱、Minimax）进行大规模前置生成，再用Kimi等交叉验证，最终由海外高价模型（如Claude）终审，单日可压降成本数十至上百美元 [1][14] **3. 开源模型商业模式** * 授权分成主要分两类：MIT协议（如DeepSeek）可商用无需分成；Apache 2.0协议（如Minimax、Kimi）需授权分成，平台一般抽取约25%的利润抽成 [27]

Token 出海

API 聚合平台

Artificial Intelligence

Artificial Intelligence

大模型

Token