Token低价陷阱 - Reportify

文章核心观点 - 大模型Token单价大幅下降，但企业AI总支出因复杂任务消耗量剧增而持续上升，形成“价格撕裂”现象[4][7][16] - 产业链利润在价格撕裂中进行再分配，掌握稀缺资源、关键能力和高粘性场景的环节更具持续收费能力[8][17] - 投资逻辑从比拼模型单价转向寻找产业链中具备不可替代性、定价权和利润份额的环节[30][44] AI Token价格与成本趋势 - Token单价大幅下降：以OpenAI GPT-4为例，其每百万Token输入价格从2023年3月的30美元降至2024年5月的5美元，部分通用推理Token价格在三年内最高降幅达99%[4][5] - 企业总支出不降反升：企业AI应用从简单问答转向Agent协作、代码生成等复杂工作流，此类任务Token消耗量是简单问答的十倍甚至百倍，导致算力总支出膨胀[7][14] - 成本结构分化：可压缩的通用任务Token成本逼近“水电价”，而编程、Agent协作等不可压缩的高消耗场景正被剥离为“旗舰能力”并按更高价格计费[10][12] 上游产业链分析 - 核心环节与定价权：上游包括计算芯片、高速存储、高速互联、智算中心基础设施等，定价权掌握在卡住物理瓶颈的环节[20][21] - HBM与GPU：HBM因产能周期长、扩产慢（需24–36个月）且被大客户长协锁定，供给刚性形成利润护城河；SK海力士2025年Q4毛利率达69%[22][23] - 光模块：800G向1.6T升级驱动赛道走强，头部厂商如中际旭创、新易盛毛利率从早年30%左右攀升至40%以上，但客户集中风险高（前五大客户收入贡献超7成）[25][26] - 电力与散热：液冷因单卡功耗上升成为刚需，特锐德“算电岛”方案可将Token用电成本降低约30%[27] - 服务器组装：该环节“量大、利薄”，以浪潮信息为例，2025年毛利率仅5%左右，缺乏定价权[28] - 投资逻辑差异：HBM/GPU依赖物理硬约束；光模块/液冷依赖需求超预期假设；电力/液冷兼具刚需安全边际与AI弹性；服务器组装则缺乏不可替代性[29][30] 中游产业链分析 - 核心逻辑与玩家：中游包括云厂商、算力租赁平台、大模型供应商及运营商，核心逻辑是通过分层定价实现利润最大化[32] - 云厂商策略：阿里、腾讯、百度等云厂商通过下调通用模型价格抢占入口，再对专属集群、弹性算力等高阶服务收取溢价，将收费模式转向“企业生产流水的过路费”[32] - 模型厂商分层定价：模型厂商通过模型档位划分价格池，例如智谱GLM-5.1（针对编程与Agent场景）与GLM-4.7（日常轻量任务）价差约3倍[10][33] - 估值差异：中国AI科技股如阿里巴巴、腾讯控股估值约15倍，低于美国同类（微软/亚马逊/谷歌约27倍），因市场仍用“传统互联网”框架定价[33] - 其他中游玩家：运营商将AI算力包装成“流量包”；算力租赁商商业模式缺乏技术壁垒，易受供需逆转冲击[34][35] 下游产业链分析 - 场景壁垒是关键：下游出现剧烈分化，有场景壁垒、用户粘性和付费闭环的公司能享受红利，如AI办公、编程、法律、医疗等领域[37][38] - 典型代表：金山办公将AI能力嵌入文档场景，2025年WPS AI国内月活突破8013万，同比暴涨307%，日均Token调用量超2000亿，同比增长超12倍，同期营收59.29亿元，毛利率达85.95%[38] - Token治理能力：AI FinOps（成本治理能力）成为新机会，用于跟踪模型调用、Token消耗和建立熔断机制，以控制企业AI运营成本[39][40] - 投资分水岭：下游公司需具备“场景壁垒”或“Token治理能力”，否则易陷入同质化竞争或被成本反噬[40] 产业链投资机会总结 - 短期机会：确定性最高的机会集中在上游供给侧的硬约束资产，如HBM、GPU、光模块、电力、液冷和数据中心基础设施[43] - 中期机会：弹性来自云厂商和模型厂商的分层定价能力，即能否将通用Token调用量转化为企业级服务收入[43] - 长期机会：最大价值将回归下游场景，真正嵌入工作流、掌握用户和数据闭环的AI应用，以及拥有Token FinOps能力的企业将受益[44]