Workflow
API 聚合平台
icon
搜索文档
Token出海专家访谈
2026-03-04 22:17
行业与公司 * **行业**: AI大模型、Token出海、API聚合平台、算力与电力基础设施 [1] * **涉及公司/模型**: * **国内模型/厂商**: 智谱(智谱清言)、Minimax、月之暗面、Kimi、DeepSeek、支付宝 [14][24][27] * **海外模型/厂商**: OpenAI、Claude、Mistral、K、W、D [3][5][14][16] * **聚合平台**: OpenRouter、ai.cc、Together.ai、Pax and AI、POE、Portkey [1][6][13][14] * **云平台/大厂**: 微软、Google、AWS、字节、阿里 [2][6][14][20] 核心观点与论据 **1. Token出海商业模式与产业链** * 商业模式形成“激活平台—模型厂商—算力提供方”三方联动,激活平台作为流量聚合与统一入口,按“每100万token”向用户收费,再与后端模型和算力方分成 [1][2] * 算力侧需与国内电力网络运营商完成基础成本结算 [2] **2. 市场现状与增长驱动** * 2026年一季度,以OpenRouter为代表的独立API聚合平台进入爆发期,全行业日均Token输出规模预计超50万亿,年增速达400% [1] * 2026年全国Token日均消耗量预计达700-800万亿;2027年受Agent化(消耗量提升7-8倍)及全模态演进驱动,日均消耗有望增长5倍至3,500-4,000万亿 [1][20] * 增长核心驱动:供给侧国内模型能力提升(如智谱清言排名进入全球前六),需求侧开发者采用“前置+交叉验证”策略以降本,带动聚合平台调用量上升 [14] **3. 定价与成本结构** * **显著价差**: 国内大模型凭借1/8至1/10的显著价格优势出海,海外模型(如OpenAI、Claude)价格约十几到二十美元/百万token,国内模型最低约0.8美元/百万token [1][3][16] * **成本构成**: Token生成成本中电力(35%-45%)与算力折旧(25%-35%)为核心,其次为带宽(10%-15%)和运维人力成本(15%-20%) [1][17] * **定价策略**: 聚合平台定价较官方价更便宜,机制包括按输入/输出分别定价(输出单价是输入的4~6倍)、按“命中率”定价(缓存命中后价格低约20%~30%)、提供预留容量/承诺量优惠(如承诺月消费1万亿tokens可获7折) [15] **4. 国内模型的竞争优势与不足** * **优势**: * **价格与效率**: 极致稀疏激活(如4%激活率)实现推理效率领先,首Token生成速度快于海外20% [1][18] * **多语种能力**: 语种覆盖超过200种,在东南亚等小语种(泰语、越南语、印尼语等)上能力与性价比更突出 [1][16][18] * **架构灵活**: 可同时使用英伟达与国产硬件方案 [18] * **不足/风险**: 技术路径迭代可能滞后,若海外快速对齐全模态能力而国内停留于语言模型阶段,将面临代差风险 [23] **5. 出海路径与客户画像** * **主要路径**: 1) 模型部署到海外云平台(微软、Google等);2) 在AWS等云平台部署;3) 通过激活平台在海外获客并聚合流量。当前主流流量仍在云平台,激活平台合计约占市场10% [6] * **更可能使用中国本土算力与电力的路径**: 聚合/激活平台链路,即海外获客、国内提供推理算力与电力支撑的模式 [7] * **客户画像**: * **B端/开发者**: 中小企业与开发者偏好通过OpenRouter等聚合平台接入,以获得折扣和灵活切换模型的能力 [9] * **C端用户**: 通过云上按量付费(pay as you go),典型做法是先预充值(如按“每100万token”充值),后端调用聚合平台的token支撑前端服务 [12] * **OpenRouter核心用户**: 自由开发者/小团队、具备C端流量的编程工具类产品、海外中小企业 [24] **6. 合规、延迟与基础设施要求** * **合规**: 低风险场景(如日常对话)可由国内算力服务海外;中高风险场景(如法律、编程)需满足本地合规,将数据与推理部署在海外合规站点 [10] * **延迟与布局**: 海外用户请求回源中国本土推理延迟约100毫秒,绕行国际光缆可能达200-500毫秒。为改善体验(需压至300毫秒以下),算力出海需配合边缘计算节点 [3][18] * **海外部署成本**: 若在海外(如新加坡)部署站点调用,定价约为海外头部模型的1/4,但相较国内部署价格上浮约2倍,主因合规成本、当地电价及更高带宽成本 [19] **7. 竞争格局与市场份额** * 市场玩家分三类:1) 独立聚合平台(如OpenRouter、ai.cc),合计占市场约30%;2) 大厂自有平台(AWS、Google、微软等),占约60%;3) 垂直平台(Pax and AI等) [13] * 在独立聚合平台内部,OpenRouter市占率约40%-50%,服务开发者规模超500万,年增速约400%;ai.cc市占率约15% [13][14] **8. 产业机会与风险** * **机会**: Token出海带动中国算力与电力配套输出,市场可覆盖东南亚、日韩、中东、欧洲等区域,边缘计算服务成为重要配套基础设施 [21][22] * **风险**: 1) 地缘政治不确定性;2) 硬件/电力成本波动;3) 海外头部平台的生态封锁;4) 全模态技术路径迭代滞后导致的代差风险 [3][23] 其他重要信息 **1. 交易体量与占比** * 2026年一季度,OpenRouter平台日均token输出规模预计超50万亿,年度口径约1,800万亿 [8] * 2025年官网披露日均token消耗量为30万亿,全年约10.95千万亿 [19] * 2026年2月底,中国企业在OpenRouter上月度量约22万亿,占该平台总量约60% [25] **2. 开发者降本策略** * 采用“前置+交叉验证”策略:先用高性价比国内模型(如智谱、Minimax)进行大规模前置生成,再用Kimi等交叉验证,最终由海外高价模型(如Claude)终审,单日可压降成本数十至上百美元 [1][14] **3. 开源模型商业模式** * 授权分成主要分两类:MIT协议(如DeepSeek)可商用无需分成;Apache 2.0协议(如Minimax、Kimi)需授权分成,平台一般抽取约25%的利润抽成 [27]