计算机行业周报：OpenClaw引爆智能体浪潮，Token消耗迎来指数级跃升

报告行业投资评级 - 增持（维持）[5] 报告的核心观点 - AI Agent（特别是OpenClaw）正从试点进入规模化落地阶段，其渗透率和任务复杂度的提升正驱动Token消耗量迎来指数级增长，并催生刚性算力需求[1][2][4] - Token消耗激增导致主流模型厂商出现算力缺口，算力供需错配加剧，正从技术和经济层面驱动算力产业链（芯片、架构、系统）的全面升级[3][4] - 随着国内市场Token消耗量爆发，国产算力有望凭借成本优势及生态完善，在基础设施层逐步占据主导地位[4] 根据相关目录分别进行总结 1. Agent泛化：Agent进入实际落地阶段，OpenClaw引领渗透加速 - OpenClaw成为重要催化剂：2026年初推出的OpenClaw是一款可在用户自有设备上运行的个人AI助手，一经推出便全球爆火，成为AI Agent普及化加速的重要催化[1][11] - 用户数据验证火爆程度：在OpenRouter平台上，OpenClaw是2026年2月5日至3月5日期间Token消耗量最多的应用，高达7.63T tokens，远超第二名[13][15] - Token消耗量飙升：以OpenRouter平台数据为例，OpenClaw的Token消耗量从2026年2月3日的80.6B飙升至3月4日的358B，一个月间翻了约4.4倍[1][15] - 厂商积极布局：各大模型厂商纷纷加大Agent布局，例如Minimax Agent已能处理复杂任务，如为HR自动整合20所名校的校招信息，或自动分类整理500张电商图片，AI Agent已进入实际落地阶段[19][20][23] 2. 需求爆发：任务密度与复杂度提升，Token消耗迎来指数级跃升 - Agent特性导致高消耗：由于AI Agent天然具备多工具调用、长上下文、多流程工作特性，其Token消耗量增长速度极快[2][24] - 算力需求呈指数增长：以单次对话机器人为基准，图像生成、推理、视频生成、深度研究的算力需求分别为10倍、100倍、3000倍、1000000倍[24][26] - 中国市场消耗量激增：中国整体日均Token消耗从2024年初的1000亿，增长至2025年中的30万亿，再到2026年2月主流大模型合计日均Token消耗已达180万亿级别[2][30] - 市场规模与渗透率预测：预计中国AI Agent市场规模将从2023年的574亿元飙升至2028年的33009亿元，年复合增长率达125%[30][34]。KA（大客户）及SMB（中小企业）企业Agent渗透率预计从2023年的3%/0.5%提升至2028年的25%/10%[30][34] - 长期增长动力强劲：根据IDC预测，中国活跃智能体数量将在2031年突破3.5亿，年复合增长率超135%，伴随任务复杂度提升，智能体Token消耗将迎来年均超30倍的指数级跃升[2][32] 3. 供给缺口：推理算力缺口显现，成本体验权衡驱动产业升级 - 算力需求转向推理：智能体核心开销集中在推理阶段，推理负载占比预计从2024年的65%提升至2028年的73%[3][36][40] - 推理市场规模扩大：中国推理算力市场规模预计从2024年的175.2亿元增长至2028年的2931.2亿元，2024-2028年复合增长率约102%[37][39] - 厂商出现算力缺口：Token消耗骤增导致主流模型厂商算力缺口显现，例如月之暗面公开表示缺卡并寻求算力支持，智谱因GLM5过于火爆对coding plan采取每日限售措施[3][42][44] - 需平衡延迟、吞吐与成本：Token消耗和算力需求非简单线性关系，需权衡延迟和吞吐以平衡经济性和用户体验[3][43] - 产业化三要素：AI Agent产业化的核心要素是模型能力、交互速度和Token成本，三者共同决定了应用的经济性与广泛性[47][48] - 产业链升级路径：为达成三元平衡，需从三方面协同发力： - 算力芯片端：提升性能与能效比，例如英伟达新架构实现推理吞吐量提升约10倍，成本降低10倍；亚马逊Trainium芯片在推理任务中比英伟达H100 GPU便宜约30%至40%[50][52] - 架构设计端：通过注意力机制革新（如PagedAttention、RadixAttention）、动态批处理演进、内存调度优化等技术降低单Token算力消耗[54] - 系统协同端：依托超节点协同技术优化资源利用率与整体能效，实现规模化部署下的综合成本下降[54] 4. 投资建议 - 关注国产算力：建议关注海光信息、寒武纪、摩尔线程、沐曦股份等国产算力公司[4][55] - 关注超节点：建议关注中科曙光、浪潮信息等超节点公司[4][55]