当AI从租GPU走向卖Token,谁会赚到真正的钱?
虎嗅APP·2026-05-18 18:24

AI算力服务模式演变的核心驱动力 - AI产业重心从大模型训练转向推理服务,行业竞争从拥有GPU资源转向低成本、稳定地生产和调度Token[4] - 传统“算力租赁”模式(出租GPU服务器)在推理阶段暴露出局限性:收入固定弹性有限、易陷入同质化价格战、客户需自行承担复杂的全套推理体系运维[7][8] - 大模型公司和互联网大厂面临资本开支重、运营复杂、合规要求高的压力,产生将推理能力外包的需求,推动产业分工深化[8] Token工厂模式的定义与吸引力 - Token工厂是新的推理服务模式,拥有重资产底座,直接承接模型推理任务并按Token消耗收费或与模型方分成,类似AI时代的“代工厂”或“炼油厂”[10] - 该模式同时满足上下游需求:模型厂商可外包推理产能专注研发,下游客户可通过标准API获得稳定AI服务而无需深度介入部署[11] - 收入模式从固定租金变为与下游调用量相关,有机会分享AI应用增长的红利,其业务毛利率显著高于传统算力租赁[11] - 竞争壁垒在于工程优化能力而非单纯拥有GPU,关键是在相同硬件条件下通过模型压缩、量化、推理引擎优化等手段降低单位Token成本[11] - 该模式是更先进的产业分工,但属于“AI时代的重资产基础设施”,其长期资本回报需关注产能利用率、折旧周期、再投资压力及定价权,技术领先优势可能因开源工具和通用框架的演进而被缩短[12][24] Token运营平台的定义与价值 - Token运营平台解决AI模型的“流通问题”,聚合不同模型与服务商,为开发者和企业提供统一、稳定的服务入口,降低接入门槛并实现智能路由[15] - 平台价值在于降低接入门槛、提供稳定性保障、在效果与成本间实现智能路由最优解,类似AI时代的“流量调度中心”[15] - 商业模式较轻资产,收入来源于服务溢价,长期价值在于形成平台效应和客户粘性[15] - 独立平台面临云厂商自有MaaS平台的竞争,需提供更强的跨云调度、故障切换能力或形成数据飞轮等独特价值,否则易被吸收[16] - 目前该赛道想象空间大但护城河未完全建立,可能成为入口也可能仅停留在工具层,从投资视角可视为“期权型机会”[17] AI产业的深层变化与投资跟踪方向 - 产业正发生三大深层变化:从“卖资源”转向“卖结果”;从“大厂全包”转向“专业分工”;从“概念驱动”转向“商业闭环驱动”[19] - 值得跟踪的方向包括:已绑定互联网大厂或模型厂商头部客户的Token工厂,尤其是深度绑定非自研模型或嵌入客户核心流程的玩家[21] - 值得跟踪的方向包括:在AI Coding、企业服务等垂直场景有应用入口和客户基础,能形成持续Token消耗闭环的公司[21] - 值得跟踪的方向包括:专注推理优化、能在特定领域将效率做到极致以获取议价能力的技术型公司[21] - 值得跟踪的方向包括:具备平台属性、能提供云厂商增量价值(如统一入口、智能调度)的Token运营商[21] 新赛道面临的关键挑战与门槛 - 行业发展受算力资源(高端芯片、稳定集群)供给约束,供应链收紧可能影响扩张计划[24] - 行业难以避免价格竞争,价格下行是技术产业成熟常见现象,最终比拼的是成本控制和运营效率[24] - 需警惕概念先行,拥有算力或能聚合接口不等于能做好Token工厂或运营平台,中间隔着重大的客户、交付、调度及长期运营能力差距[24] - 投资层面需关注资本回报(如长期ROIC、自由现金流)和定价权,高毛利不一定等于高回报,夹在强势上下游中间可能影响长期利润[25] - 最终能穿越周期的是扎实进行能力建设的公司,而非仅借概念讲故事者,且产业链中“卖铲子”的基础设施供应商可能依然赚得最稳[25]

当AI从租GPU走向卖Token,谁会赚到真正的钱? - Reportify