Token低价陷阱
投中网·2026-06-22 12:16

文章核心观点 - 大模型Token单价大幅下降,但企业AI总支出因复杂任务消耗量剧增而持续上升,形成“价格撕裂”现象[4][7][16] - 产业链利润在价格撕裂中进行再分配,掌握稀缺资源、关键能力和高粘性场景的环节更具持续收费能力[8][17] - 投资逻辑从比拼模型单价转向寻找产业链中具备不可替代性、定价权和利润份额的环节[30][44] AI Token价格与成本趋势 - Token单价大幅下降:以OpenAI GPT-4为例,其每百万Token输入价格从2023年3月的30美元降至2024年5月的5美元,部分通用推理Token价格在三年内最高降幅达99%[4][5] - 企业总支出不降反升:企业AI应用从简单问答转向Agent协作、代码生成等复杂工作流,此类任务Token消耗量是简单问答的十倍甚至百倍,导致算力总支出膨胀[7][14] - 成本结构分化:可压缩的通用任务Token成本逼近“水电价”,而编程、Agent协作等不可压缩的高消耗场景正被剥离为“旗舰能力”并按更高价格计费[10][12] 上游产业链分析 - 核心环节与定价权:上游包括计算芯片、高速存储、高速互联、智算中心基础设施等,定价权掌握在卡住物理瓶颈的环节[20][21] - HBM与GPU:HBM因产能周期长、扩产慢(需24–36个月)且被大客户长协锁定,供给刚性形成利润护城河;SK海力士2025年Q4毛利率达69%[22][23] - 光模块:800G向1.6T升级驱动赛道走强,头部厂商如中际旭创、新易盛毛利率从早年30%左右攀升至40%以上,但客户集中风险高(前五大客户收入贡献超7成)[25][26] - 电力与散热:液冷因单卡功耗上升成为刚需,特锐德“算电岛”方案可将Token用电成本降低约30%[27] - 服务器组装:该环节“量大、利薄”,以浪潮信息为例,2025年毛利率仅5%左右,缺乏定价权[28] - 投资逻辑差异:HBM/GPU依赖物理硬约束;光模块/液冷依赖需求超预期假设;电力/液冷兼具刚需安全边际与AI弹性;服务器组装则缺乏不可替代性[29][30] 中游产业链分析 - 核心逻辑与玩家:中游包括云厂商、算力租赁平台、大模型供应商及运营商,核心逻辑是通过分层定价实现利润最大化[32] - 云厂商策略:阿里、腾讯、百度等云厂商通过下调通用模型价格抢占入口,再对专属集群、弹性算力等高阶服务收取溢价,将收费模式转向“企业生产流水的过路费”[32] - 模型厂商分层定价:模型厂商通过模型档位划分价格池,例如智谱GLM-5.1(针对编程与Agent场景)与GLM-4.7(日常轻量任务)价差约3倍[10][33] - 估值差异:中国AI科技股如阿里巴巴、腾讯控股估值约15倍,低于美国同类(微软/亚马逊/谷歌约27倍),因市场仍用“传统互联网”框架定价[33] - 其他中游玩家:运营商将AI算力包装成“流量包”;算力租赁商商业模式缺乏技术壁垒,易受供需逆转冲击[34][35] 下游产业链分析 - 场景壁垒是关键:下游出现剧烈分化,有场景壁垒、用户粘性和付费闭环的公司能享受红利,如AI办公、编程、法律、医疗等领域[37][38] - 典型代表:金山办公将AI能力嵌入文档场景,2025年WPS AI国内月活突破8013万,同比暴涨307%,日均Token调用量超2000亿,同比增长超12倍,同期营收59.29亿元,毛利率达85.95%[38] - Token治理能力:AI FinOps(成本治理能力)成为新机会,用于跟踪模型调用、Token消耗和建立熔断机制,以控制企业AI运营成本[39][40] - 投资分水岭:下游公司需具备“场景壁垒”或“Token治理能力”,否则易陷入同质化竞争或被成本反噬[40] 产业链投资机会总结 - 短期机会:确定性最高的机会集中在上游供给侧的硬约束资产,如HBM、GPU、光模块、电力、液冷和数据中心基础设施[43] - 中期机会:弹性来自云厂商和模型厂商的分层定价能力,即能否将通用Token调用量转化为企业级服务收入[43] - 长期机会:最大价值将回归下游场景,真正嵌入工作流、掌握用户和数据闭环的AI应用,以及拥有Token FinOps能力的企业将受益[44]

Token低价陷阱 - Reportify