报告行业投资评级 - 增持(维持)[5] 报告的核心观点 - AI Agent(特别是OpenClaw)正从试点进入规模化落地阶段,其渗透率和任务复杂度的提升正驱动Token消耗量迎来指数级增长,并催生刚性算力需求[1][2][4] - Token消耗激增导致主流模型厂商出现算力缺口,算力供需错配加剧,正从技术和经济层面驱动算力产业链(芯片、架构、系统)的全面升级[3][4] - 随着国内市场Token消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导地位[4] 根据相关目录分别进行总结 1. Agent泛化:Agent进入实际落地阶段,OpenClaw引领渗透加速 - OpenClaw成为重要催化剂:2026年初推出的OpenClaw是一款可在用户自有设备上运行的个人AI助手,一经推出便全球爆火,成为AI Agent普及化加速的重要催化[1][11] - 用户数据验证火爆程度:在OpenRouter平台上,OpenClaw是2026年2月5日至3月5日期间Token消耗量最多的应用,高达7.63T tokens,远超第二名[13][15] - Token消耗量飙升:以OpenRouter平台数据为例,OpenClaw的Token消耗量从2026年2月3日的80.6B飙升至3月4日的358B,一个月间翻了约4.4倍[1][15] - 厂商积极布局:各大模型厂商纷纷加大Agent布局,例如Minimax Agent已能处理复杂任务,如为HR自动整合20所名校的校招信息,或自动分类整理500张电商图片,AI Agent已进入实际落地阶段[19][20][23] 2. 需求爆发:任务密度与复杂度提升,Token消耗迎来指数级跃升 - Agent特性导致高消耗:由于AI Agent天然具备多工具调用、长上下文、多流程工作特性,其Token消耗量增长速度极快[2][24] - 算力需求呈指数增长:以单次对话机器人为基准,图像生成、推理、视频生成、深度研究的算力需求分别为10倍、100倍、3000倍、1000000倍[24][26] - 中国市场消耗量激增:中国整体日均Token消耗从2024年初的1000亿,增长至2025年中的30万亿,再到2026年2月主流大模型合计日均Token消耗已达180万亿级别[2][30] - 市场规模与渗透率预测:预计中国AI Agent市场规模将从2023年的574亿元飙升至2028年的33009亿元,年复合增长率达125%[30][34]。KA(大客户)及SMB(中小企业)企业Agent渗透率预计从2023年的3%/0.5%提升至2028年的25%/10%[30][34] - 长期增长动力强劲:根据IDC预测,中国活跃智能体数量将在2031年突破3.5亿,年复合增长率超135%,伴随任务复杂度提升,智能体Token消耗将迎来年均超30倍的指数级跃升[2][32] 3. 供给缺口:推理算力缺口显现,成本体验权衡驱动产业升级 - 算力需求转向推理:智能体核心开销集中在推理阶段,推理负载占比预计从2024年的65%提升至2028年的73%[3][36][40] - 推理市场规模扩大:中国推理算力市场规模预计从2024年的175.2亿元增长至2028年的2931.2亿元,2024-2028年复合增长率约102%[37][39] - 厂商出现算力缺口:Token消耗骤增导致主流模型厂商算力缺口显现,例如月之暗面公开表示缺卡并寻求算力支持,智谱因GLM5过于火爆对coding plan采取每日限售措施[3][42][44] - 需平衡延迟、吞吐与成本:Token消耗和算力需求非简单线性关系,需权衡延迟和吞吐以平衡经济性和用户体验[3][43] - 产业化三要素:AI Agent产业化的核心要素是模型能力、交互速度和Token成本,三者共同决定了应用的经济性与广泛性[47][48] - 产业链升级路径:为达成三元平衡,需从三方面协同发力: - 算力芯片端:提升性能与能效比,例如英伟达新架构实现推理吞吐量提升约10倍,成本降低10倍;亚马逊Trainium芯片在推理任务中比英伟达H100 GPU便宜约30%至40%[50][52] - 架构设计端:通过注意力机制革新(如PagedAttention、RadixAttention)、动态批处理演进、内存调度优化等技术降低单Token算力消耗[54] - 系统协同端:依托超节点协同技术优化资源利用率与整体能效,实现规模化部署下的综合成本下降[54] 4. 投资建议 - 关注国产算力:建议关注海光信息、寒武纪、摩尔线程、沐曦股份等国产算力公司[4][55] - 关注超节点:建议关注中科曙光、浪潮信息等超节点公司[4][55]
计算机行业周报:OpenClaw引爆智能体浪潮,Token消耗迎来指数级跃升