报告行业投资评级 - 推荐 维持评级 [6] 报告的核心观点 - Token需求“通胀”指单位时间内、单位用户的Token消耗结构性上升,其正成为大模型时代新的、可计量的生产资料,改变了传统互联网的免费商业模式[3][4][5][8][10] - 大模型厂商通过提价和分层定价,将算力稀缺转化为议价权,有望改善其毛利与现金流质量[3][5][10] - 行业定价逻辑正从云计算时代的“卖资源”转向大模型时代的“卖Token燃料+卖成果”[10] 行业趋势与逻辑转变 - 传统互联网软件依赖免费模式获取用户规模,其边际成本极低[3] - 云计算时代计费单位变为CPU/存储/带宽/请求数,客户习惯“按量计费”[4] - 大模型时代计量单位从流量转向Token,Token消耗在编程、Agent等场景成为刚需,是强依赖算力的生产资料[4][5][8] - 智谱GLM Coding Plan涨价至少30%,此前因用户增长导致算力紧张而“限量发售”,形成“需求增长→资源约束→涨价”的典型供需链条[3][5] Token需求“通胀”的驱动因素 - 从“问答”变为“干活”:用户让模型重构代码、改写文件、生成文档等,编程场景具有长上下文、多轮迭代、大量输出的特征,消耗大量Token[8] - 从“单轮”到“Agent的多轮”:Agent(如智谱GLM-5、MiniMax M2.5)会主动规划、检索、执行、反思,多次调用模型,Token消耗按步骤累加[8][10] - 推理强度上升:更多“深度思考、更长链路推理”显著提高输出与中间过程的Token消耗,用户愿意增加Token投入换取更高成功率与更少返工[10] 产业链投资建议 - 大模型厂商:关注能在编程、Agent、企业流程等高ROI场景中维持订阅留存与企业席位扩张,并将Token用量稳定转化为交付价值的公司,如MiniMax和智谱[11] - 云厂商与算力基础设施:AI拉动的IT支出与基础设施投入仍处上行周期,云侧有望受益于GPU算力、存储与网络I/O等“伴随型消耗”的持续增长,关注金山云、优刻得、首都在线等[11] - 安全治理与运行时的防护工具:随着AI嵌入工作流,数据泄露、代理越权等风险有望推动“AI安全平台/治理平台”成为刚需,关注深信服、启明星辰、三六零等[11] 关键市场动态与数据 - 智谱于2月12日宣布上调GLM Coding Plan订阅价格,涨幅“至少30%”[3] - 海外云厂商近期纷纷提价,例如Google Cloud在北美涨价幅度达100%(从$0.04/GiB涨至$0.08/GiB),在欧洲与亚洲也同步上调[3][16] - AWS的价格也上调了约15%[3]
再谈Token需求“通胀”:从云到大模型
国联民生证券·2026-02-13 19:13