Token通胀 - 财报，业绩电话会，研报，新闻

Token通胀

搜索文档

国联民生证券· 2026-04-10 21:00

报告行业投资评级 - 推荐维持评级 [3] 报告的核心观点 - 以OpenClaw为代表的AI Agent（智能体）标志着AI从“对话工具”向“自主作业”的跨代飞跃，正开启人人可用的AI Agent时代 [1][12] - AI Agent的持续运行将驱动互联网和企业IT的计费逻辑从流量、时长竞争，转向以Token消耗、执行完成度、安全治理等为核心的新模式 [1][15] - “龙虾”（OpenClaw）爆火预示Agent时代Token需求将非线性增长，直接带来超预期的AI算力与大模型调用需求，并系统性重估芯片、模型、云平台三个层面 [1] - 投资应围绕“Agent渗透率提升—Token通胀—云与模型重定价”主线，短期关注云平台，中期关注模型厂商，长期看好国产算力芯片 [8][130] 根据相关目录分别进行总结 1 OpenClaw：开启人人可用的AI Agent时代 - OpenClaw（原名Clawdbot）作为24小时全天候个人AI助手，以其自动化逻辑与代码生成能力迅速出圈，标志着AI从“被动问答”向“自主作业”的跨代飞跃，正拉开Agent渗透工业化生产工作流的序幕 [12] - 它重塑了云端的竞争逻辑，迫使云厂商从算力基础设施方加速转型为智能体全栈底座服务商，未来的云将成为由无数Agent高效协作构成的自动化操作系统 [13] - 互联网交互入口可能从分散App收拢至Agent统一界面，用户行为从“信息检索”转向“意图达成”，商业逻辑从“时长收割”向“任务溢价”转型 [14] - 技术与商业收敛的核心是可控性与可结算性，计价方式将从“流量”转向“单位执行量计价、安全治理计价和资源供给计价” [15] - Agent时代的关键付费机制包括：可执行能力付费、资源使用付费、安全与治理付费、授权与访问付费、结果/转化付费 [16] 2 OpenClaw安装部署：从体验到深度定制 - OpenClaw的核心机制包括Workspace（工作台）和Skills（技能集），使其成为一个事件驱动型执行网络，支持通过自然语言对话自主生成可复用技能模块 [36] - 部署方式按技术复杂度分为五大类：云托管即用型、大厂云服务器镜像型、国产本地桌面客户端型、国产兼容框架型、原版自托管+灵活配置型，成本从免费到弹性不等，适用于从个人体验到专业开发者的不同人群 [38] 3 OpenClaw驱动的三大受益方向 3.1 CPU和国产芯片 - AI产业正从“单次对话大模型”向“全天候智能体”跨越，算力需求从“单次脉冲”变为“全天候常驻”，大幅推高芯片需求天花板 [42] - Agent系统本质是以CPU为核心的控制与编排中枢，其调度密集型任务（如网页抓取、状态持久化）激增，将驱动AI基建投资主线从“唯GPU论”向多核CPU、高带宽内存等全栈服务器组件扩散 [43] - 根据英特尔研究，Agent工作负载中CPU上的工具处理延迟占比最高达90.6%，CPU可能比GPU更早成为性能瓶颈 [44] - 基于IDC等机构预测进行测算，在保守/中性/乐观假设下，为满足Agent带来的Token消耗增长，长期全球可能需要新增约587万片、1174万片、1761万片CPU [47][49] - 在算力缺口与供应链自主可控趋势共振下，国产芯片厂商将直接受益，包括：寒武纪（AI加速卡）、海光信息（CPU与DCU）、云天励飞（推理芯片）、中国长城（服务器整机）、龙芯中科（端侧智能体）、天数智芯与壁仞科技（通用GPU）等 [52][53] 3.2 大模型 - OpenClaw在GitHub星标超13万个，官网访问量破200万人次，其流行直接导致API调用频次与Token吞吐的阶跃式抬升 [54] - 相比传统对话，面向复杂任务的Agent服务可能会消耗数十倍多的Token，因此“模型的单位成本×单位产出”成为规模化落地的关键 [56] - **MiniMax**：其M2.1模型因高性价比（定价约为Claude Sonnet的8%）、长文本能力强、推理与编程能力突出，被OpenClaw创始人推荐，更适合被高频工作流调用 [54][57]。其多模态能力支持“视觉执行的自动化” [59]。公司采用MoE架构实现“大参数量、小激活量”，在保证性能的同时显著降低推理成本 [91]。2026年2月，其年度经常性收入（ARR）已超1.5亿美元，核心模型单日Token消耗量达到2025年12月的6倍以上 [82] - **智谱AI**：具备全球领先的coding技术能力，其GLM-4.5模型在全球基准检验中排名第三、中国第一 [94]。公司通过MaaS平台构建增长飞轮，并与腾讯WorkBuddy等生态深度协同 [68]。2026年3月31日，其MaaS API平台实现ARR 17亿元 [82]。2026年2月，智谱上调GLM Coding Plan订阅价格至少30%，反映出模型层定价权提升 [115] - 国产大模型厂商通过推出“开箱即用”产品（如KimiClaw、AutoClaw、MaxClaw）降低部署门槛，抢占生态入口，并与硬件（如绿联NAS）深度绑定，构建数据飞轮和较高的用户迁移成本壁垒 [67][69][83][84] 3.3 云厂商 - 云厂商的商业逻辑已从“底层算力租赁”跃升为“Agent数字员工的工位提供商”，通过一键部署和价格补贴抢占应用入口，争夺模型分发权和后续扩容权 [1][103] - 供给端，云厂商（如腾讯云）推出预装镜像和拉新优惠政策（如“0元直领”），意在抢占Agent首次部署的入口，将用户锁定在自家生态内 [105] - 计费模式正从单纯的Token按量计费，转向“套餐资源包+部署费+模型调用”的复合模式。例如，腾讯云部署OpenClaw服务收费49元/次/月，联网搜索、长期记忆存储等另行计费 [106][114] - 云厂商作为“卖铲人”迎来三重价值重估：1) **高确定性**：带动边缘计算节点和轻量服务器需求，去化库存；2) **高弹性**：Agent任务使Token消耗呈数十倍增长，带动模型API计费收入指数级增长；3) **长期壁垒高**：通过提供企业级AI工作平台、安全治理等增值服务获取溢价 [107][109] - “开箱即用”产品（如小米Xiaomi miclaw、顺网科技方案）的繁荣，将产生的海量并发请求和存储需求反哺至底层公有云基础设施 [110][111] - Token需求“通胀”带动云与模型涨价趋势，例如Google Cloud在北美CDN价格从$0.04/GiB涨至$0.08/GiB，智谱也上调了Coding Plan价格，产业定价逻辑正从“卖流量”转向“卖Token燃料+卖成果” [115][118][120] - 云计算产业有望迎来收入与利润拐点，例如顺网科技股权激励计划中，2026年云业务收入目标值为3.2亿元；优刻得2025年全年毛利率达25.8%，连续五年提升并迈过盈利门槛 [125][126] 4 投资建议 - 建议重点关注一“芯”、二“模”、三“云”三条主线 [8][130] - **一“芯”**：国产AI算力芯片，如寒武纪、海光信息、云天励飞、壁仞科技、天数智芯等，长期受益于推理需求扩张和自主可控 [52][53][131] - **二“模”**：企业办公工作台与模型厂商，如MiniMax、智谱，中期受益于高频调用带来的流水放大和订阅收入增长 [8][131] - **三“云”**：AI云/推理平台，如金山云、优刻得、网宿科技等，短期商业模式清晰、落地快 [8][131] - 其他受益环节还包括：CPU（海光信息、龙芯中科等）、边缘网络与API治理（网宿科技、深信服等）、安全（安恒信息等）、IDC、本地执行节点（绿联科技、小米集团）等 [131]