Token消耗
搜索文档
策略点评:探底回升,震荡延续
德邦证券· 2026-03-16 18:23
核心观点 - 报告认为A股市场短期或仍以结构性行情为主,科技成长与传统周期之间的轮动或将成为市场主旋律,市场对外部环境的影响或将逐渐脱敏[7][17] - 报告认为1-2月宏观经济数据改善或强化经济复苏预期,短期可能对债市形成持续压力[11][17] - 报告认为地缘政治风险与供需基本面博弈将持续,原油价格可能维持高波动,白银等贵金属短期走势仍难以摆脱油价影响[11][13][17] 市场行情分析 股票市场 - 2026年3月16日A股市场呈现探底回升、结构性分化格局,上证指数收盘报4084.79点,微跌0.26%,深证成指上涨0.19%至14307.58点,创业板指表现亮眼上涨1.41%至3357.02点,科创50指数上涨0.83%至1384.99点[2] - 市场整体保持活跃,A股总成交额达到2.34万亿元,个股上涨家数为2843家,下跌家数为2489家[2] - 科技板块表现强势,存储器、先进封装、HBM、模拟芯片、覆铜板指数分别大涨5.52%、4.09%、4.08%、3.22%、3.08%,报告认为AI大模型技术超预期迭代升级下全球Token消耗量爆发式增长,或将带来海量的数据存储、处理和检索需求,推动科技领域需求持续提升[5] - 航运板块上涨3.59%,报告认为板块上涨或受中东地缘政治局势变化导致航运路线调整驱动运价预期上升[5] - 传统周期领域表现弱势,钢铁、有色金属、建筑、煤炭、电力及公用事业、基础化工、建材、石油石化板块分别下跌3.08%、2.69%、2.04%、2.01%、1.66%、1.50%、1.47%、1.06%,报告认为近期市场板块轮动效应明显,前期涨幅较大下部分个股存在获利回吐压力[5] - 报告展望后市,认为3月下旬将迎来上市公司年报密集披露期,业绩将成为影响个股表现的关键因素[7] 债券市场 - 国债期货市场全线收跌,30年期国债期货TL2606跌幅最大达到0.43%,收盘价110.63元,成交额958.93亿元,10年期国债期货T2606下跌0.11%,收盘价108.12元,成交额1027.06亿元,5年期和2年期国债期货分别下跌0.08%和0.04%[11] - 央行当日开展1373亿元7天期逆回购操作,利率1.40%,单日净投放888亿元,同时缩量续作6个月期买断式逆回购1000亿元[11] - 报告提及1-2月宏观经济数据向好:全国固定资产投资52721亿元同比增长1.8%,社会消费品零售总额86079亿元同比增长2.8%,货物进出口总额77321亿元同比增长18.3%,其中出口46178亿元增长19.2%,进口31143亿元增长17.1%,报告认为这些数据或强化经济复苏预期,短期可能对债市形成持续压力[11] 商品市场 - 南华商品指数收于3160.68点,上涨0.11%,市场呈现能化板块领涨、贵金属领跌的分化特征[11] - 涨幅靠前的均为石化产业链品种,沥青、瓶片、丙烯、乙二醇、聚丙烯分别上涨10.63%、7.44%、3.70%、3.31%、3.22%[11] - 沥青主力合约收于4464元/吨,大涨10.63%,成为涨幅最大品种,报告认为上涨原因包括美伊冲突导致原油价格上涨(布伦特油价站稳100美元/桶)带来的成本端支撑增强,以及国内沥青装置检修量环比增加0.9万吨至110.8万吨带来的供给约束[11] - 沪银主力合约下跌6.34%至20301元/千克,领跌市场,报告认为其走弱核心逻辑在于市场担忧通胀被再度推升可能导致美联储降息预期减弱,且若油价持续高位导致经济衰退预期,贵金属需求端预期也将承压[11][13] 交易热点追踪 近期热门品种梳理 - AI应用:核心逻辑为以阿里千问、谷歌GEMINI为代表的产品应用加速,后续关注应用场景转化和产品技术升级突破[14] - 商业航天:核心逻辑为商业航天司成立,大力支持发展,后续关注国内可回收火箭发射情况以及SPACEX等海外龙头技术突破[14] - 核聚变:核心逻辑为中上游环节产业化提速,后续关注项目进展推动情况和行业招标情况[14] - 量子科技:核心逻辑为技术突破,属于战略新兴产业,后续关注国内政策支持力度和国内外重点项目进展[14] - 脑机接口:核心逻辑为十五五政策支持及海外技术进步,后续关注国内技术进步和国外公司项目进展[14] - 机器人:核心逻辑为产品持续升级,产业化趋势加速,后续关注特斯拉订单释放节奏和国内企业技术进展[14] - 大消费:核心逻辑为政策推动支持消费升级,后续关注经济复苏情况和进一步刺激政策[14] - 券商:核心逻辑为A股成交额高位运行,后续关注A股市场成交量情况和交易制度可能的变化[14] - 贵金属:核心逻辑为央行持续增持及美联储降息预期,后续关注美联储进一步降息预期和地缘政治风险[14] - 有色金属:核心逻辑为供给约束,后续关注美元指数变化和全球各区域供给变化[14]
“养龙虾”引爆Token消耗量,谁能吃到AI智能体投资第一口肉?
凤凰网财经· 2026-03-13 22:08
文章核心观点 - OpenClaw(开源AI智能体)的出现标志着AI从对话转向执行,其广泛应用将直接驱动Token(词元)需求的指数级增长,并由此改变AI产业链的供需格局,为算力、大模型等基础设施环节带来确定性的投资机会 [1][4][5][8] 01 消耗有望指数级增长,离Token越近越有投资潜力 - OpenClaw等新一代AI智能体系统正将大模型从“回答问题”推进到“执行任务”,具备理解指令、调用工具、连接系统与应用的能力 [4] - 这种“代理式任务”的Token消耗量相比传统对话模式跃升1000倍,是投资链条的“第一性原理”,离Token越近的行业投资潜力越大 [5] - Token是AI处理信息的基本计费单位,AI的每次思考、读取或输出都需消耗Token [6] - 据IDC预测,活跃AI智能体数量将从2025年的约2860万快速攀升至2030年的22.16亿,伴随任务复杂度提升,底层Token消耗将出现指数级增长 [6] - IDC预测,年度Token消耗将从2025年的0.0005 PetaTokens暴增至2030年的152667 PetaTokens,复合年均增长率高达3418% [7] 02 大模型、算力等板块受追捧,有基金公司借势营销 - 市场相关板块表现活跃,截至3月12日收盘,本周以来全球算力指数和精选市场算力指数分别上涨2.41%和4.13% [9] - 港股相关个股(“龙虾三兄弟”)领涨,其中迅策在周一至周三区间涨幅超80% [2] - 有基金公司借势营销,例如富国基金发布了涵盖云服务、应用、算力芯片等多个方向的“基围虾”科技ETF矩阵 [9] - 投资机会具体传导至多个环节:大模型公司;算力端的推理算力芯片公司、LPU公司、云服务及算力租赁;端侧的硬件、存储及电脑供应链;软件端的网络安全、数据安全及与OpenClaw生态直连的软件公司 [10] - AI智能体将AI从对话工具升级为自主工作流执行者,应用场景和调用频率的指数级增长将拉动整个产业链,AI基础设施供应链是当前确定性最强的配置主线 [10] - 智能体驱动的Token消耗增长正推动算力需求从训练侧向推理侧迁移,驱动算力芯片、高带宽存储、散热模组、电源管理及光模块等核心硬件进入景气上行周期 [10] - 随着国内智算中心建设提速和国产芯片迭代,具备自主架构优势的国产算力板块有望在存量替代与增量扩张中确立主导地位 [10] - 对于算力板块,随着传输速率要求提高,PCB和光模块在资本开支中的占比或将提升,有望继续高景气增长,“算力应用-基础设施投资”正循环长期利好国产算力板块 [11] 03 产业仍处早期阶段,专家提示投资者控制仓位 - OpenClaw面临安全风险与法律困境,其获得完全磁盘访问权限后,安全漏洞可能导致数据系统性泄露,其第三方插件生态(ClawHub)也可能存在安全隐患 [12] - 当AI变成自主执行者,传统的责任归属逻辑失效,若其泄露商业机密或进行不当行为,全球相关法律几乎处于真空状态 [12] - 国家互联网应急中心已发布关于OpenClaw安全应用的风险提示,建议用户强化网络控制和凭证管理 [13] - OpenClaw产业仍处早期,技术成熟度和商业模式均未定型,工具存在高权限、弱安全的先天缺陷 [14] - 部分概念股短期涨幅已脱离基本面,存在业绩与估值不匹配的风险,随着年报季临近,市场情绪退潮可能导致相关个股剧烈回调 [14]
计算机行业周报:OpenClaw引爆智能体浪潮,Token消耗迎来指数级跃升
国盛证券· 2026-03-09 09:24
报告行业投资评级 - 增持(维持)[5] 报告的核心观点 - AI Agent(特别是OpenClaw)正从试点进入规模化落地阶段,其渗透率和任务复杂度的提升正驱动Token消耗量迎来指数级增长,并催生刚性算力需求[1][2][4] - Token消耗激增导致主流模型厂商出现算力缺口,算力供需错配加剧,正从技术和经济层面驱动算力产业链(芯片、架构、系统)的全面升级[3][4] - 随着国内市场Token消耗量爆发,国产算力有望凭借成本优势及生态完善,在基础设施层逐步占据主导地位[4] 根据相关目录分别进行总结 1. Agent泛化:Agent进入实际落地阶段,OpenClaw引领渗透加速 - **OpenClaw成为重要催化剂**:2026年初推出的OpenClaw是一款可在用户自有设备上运行的个人AI助手,一经推出便全球爆火,成为AI Agent普及化加速的重要催化[1][11] - **用户数据验证火爆程度**:在OpenRouter平台上,OpenClaw是2026年2月5日至3月5日期间Token消耗量最多的应用,高达7.63T tokens,远超第二名[13][15] - **Token消耗量飙升**:以OpenRouter平台数据为例,OpenClaw的Token消耗量从2026年2月3日的80.6B飙升至3月4日的358B,一个月间翻了约4.4倍[1][15] - **厂商积极布局**:各大模型厂商纷纷加大Agent布局,例如Minimax Agent已能处理复杂任务,如为HR自动整合20所名校的校招信息,或自动分类整理500张电商图片,AI Agent已进入实际落地阶段[19][20][23] 2. 需求爆发:任务密度与复杂度提升,Token消耗迎来指数级跃升 - **Agent特性导致高消耗**:由于AI Agent天然具备多工具调用、长上下文、多流程工作特性,其Token消耗量增长速度极快[2][24] - **算力需求呈指数增长**:以单次对话机器人为基准,图像生成、推理、视频生成、深度研究的算力需求分别为10倍、100倍、3000倍、1000000倍[24][26] - **中国市场消耗量激增**:中国整体日均Token消耗从2024年初的1000亿,增长至2025年中的30万亿,再到2026年2月主流大模型合计日均Token消耗已达180万亿级别[2][30] - **市场规模与渗透率预测**:预计中国AI Agent市场规模将从2023年的574亿元飙升至2028年的33009亿元,年复合增长率达125%[30][34]。KA(大客户)及SMB(中小企业)企业Agent渗透率预计从2023年的3%/0.5%提升至2028年的25%/10%[30][34] - **长期增长动力强劲**:根据IDC预测,中国活跃智能体数量将在2031年突破3.5亿,年复合增长率超135%,伴随任务复杂度提升,智能体Token消耗将迎来年均超30倍的指数级跃升[2][32] 3. 供给缺口:推理算力缺口显现,成本体验权衡驱动产业升级 - **算力需求转向推理**:智能体核心开销集中在推理阶段,推理负载占比预计从2024年的65%提升至2028年的73%[3][36][40] - **推理市场规模扩大**:中国推理算力市场规模预计从2024年的175.2亿元增长至2028年的2931.2亿元,2024-2028年复合增长率约102%[37][39] - **厂商出现算力缺口**:Token消耗骤增导致主流模型厂商算力缺口显现,例如月之暗面公开表示缺卡并寻求算力支持,智谱因GLM5过于火爆对coding plan采取每日限售措施[3][42][44] - **需平衡延迟、吞吐与成本**:Token消耗和算力需求非简单线性关系,需权衡延迟和吞吐以平衡经济性和用户体验[3][43] - **产业化三要素**:AI Agent产业化的核心要素是模型能力、交互速度和Token成本,三者共同决定了应用的经济性与广泛性[47][48] - **产业链升级路径**:为达成三元平衡,需从三方面协同发力: - **算力芯片端**:提升性能与能效比,例如英伟达新架构实现推理吞吐量提升约10倍,成本降低10倍;亚马逊Trainium芯片在推理任务中比英伟达H100 GPU便宜约30%至40%[50][52] - **架构设计端**:通过注意力机制革新(如PagedAttention、RadixAttention)、动态批处理演进、内存调度优化等技术降低单Token算力消耗[54] - **系统协同端**:依托超节点协同技术优化资源利用率与整体能效,实现规模化部署下的综合成本下降[54] 4. 投资建议 - **关注国产算力**:建议关注海光信息、寒武纪、摩尔线程、沐曦股份等国产算力公司[4][55] - **关注超节点**:建议关注中科曙光、浪潮信息等超节点公司[4][55]
一只龙虾,成了MiniMax、月暗、智谱的财神爷
投中网· 2026-03-04 14:46
文章核心观点 - OpenClaw的流行重塑了AI大模型行业的竞争格局,推动模型厂商从技术提供商向AI基础设施服务商转型,其核心价值从模型参数和对话能力转向Agent适配性与商业化效率 [6][8] - 中国头部AI模型公司(如MiniMax、月之暗面、智谱AI)凭借高性价比和出色的多模态与稳定性,在OpenClaw生态中占据了主导地位,实现了调用量、收入和估值的显著跃升 [6][7][8] - OpenClaw作为“Token黑洞”极大地刺激了模型API调用量,为模型厂商带来了巨大的市场机遇,同时也对算力供给和服务的稳定性提出了严峻挑战,行业竞争加剧 [8][15][18][20] 中国模型厂商的市场表现与机遇 - **市场地位显著提升**:在OpenRouter平台,2026年2月24日当周,前十位模型的总Token消耗约8.7万亿,其中中国模型独占5.3万亿,占比61% [8] - **头部厂商轮流领跑**:2026年2月,MiniMax的M2.5和月之暗面的Kimi K2.5在OpenRouter周度榜单上轮流“霸榜”,其中MiniMax M2.5的调用量连续三周位列第一 [6] - **估值与融资飞跃**:MiniMax和智谱AI在港股市场的市值双双突破3000亿港元;月之暗面在K2.5模型发布后一个多月内完成两轮累计超12亿美元融资,估值翻倍至100亿美元以上 [6] - **海外收入激增**:月之暗面依托OpenClaw生态,其API收入在K2.5发布后近20天便超过2025年全年总和,海外收入快速反超国内 [6] - **性价比优势突出**:中国模型成为OpenClaw生态最大受益方,性价比是关键优势,例如欧洲开发工作室使用Kimi K2.5的日开销约5到10美元,而全部使用Claude的月消耗在800~1500美元 [7] OpenClaw产品的特点与市场热度 - **现象级开源项目**:OpenClaw在GitHub上的星标已接近25万,超越了所有开源软件项目,成为史上最受欢迎的开源项目 [10] - **催生部署产业**:OpenClaw的部署成为新生意,淘宝店铺本地部署价格288元,小红书安装手册卖到100元,国外含硬件的现场配置开价6000美元 [10] - **企业级应用与高消耗**:企业要求员工使用并给予Token补贴,例如有公司给普通员工每天150元、技术团队每天1000元补贴;猎豹移动CEO傅盛透露每天在OpenClaw上花费超100美元 [10] - **工作流深度集成**:傅盛将OpenClaw与飞书打通,搭建多个Agent,在10天内发送了22万字交互信息,平均每小时超2000字 [11] 模型厂商的战略响应与竞争 - **加速与OpenClaw融合**:模型厂商将独立部署OpenClaw作为头等要务,以抓住Token消耗红利 [12] - **推出专属部署工具**:月之暗面于2月18日上线“Kimi Claw”,高级版用户月费至少199元;MiniMax于2月26日上线云端部署工具“MaxClaw”,上线后120小时内紧急完成四次服务扩容 [13] - **大厂积极入场**:百度智能云、腾讯、阿里等大厂加速进入桌面Agent市场,例如百度提供一键部署,腾讯内测“WorkBuddy”,阿里推出并开源“CoPaw”工具,并推出低价的Coding Plan订阅服务 [20][21][22] Token消耗激增带来的影响与挑战 - **消耗量级巨大**:OpenClaw是巨型Token消耗黑洞,有用户生成一个2000字文档就消耗700万Token,做小爬虫测试花费2900万Token,有人一天消耗5000万Token [15] - **驱动模型公司业绩**:MiniMax的M2系列文本模型在2026年2月的单日Token消耗量增长至2025年12月的超6倍,其中编程套餐的Token消耗量增长超过10倍 [16] - **价格优势显著**:中国模型定价具备竞争力,例如MiniMax M2.5海外定价为每百万Token输出2.4美元,而Anthropic Claude Sonnet 4.6为15美元,价差达6倍 [16] - **算力瓶颈凸显**:流量暴涨导致算力吃紧,智谱GLM-5因服务出现排队、延迟和卡顿,尽管多次扩容并限量发售套餐,仍导致其股价在2月23日一度下跌22%,单日蒸发超1000亿港元,并在OpenRouter榜单前9名中消失 [18] 行业未来趋势与关键成功因素 - **长期增长趋势**:行业领袖认为OpenClaw带来的增长是长期趋势的开端,是阶梯式而非线性增长 [16] - **三大高潜力方向**:预测Token消耗将在编程、办公Agent和动态生成(交互中长内容)三个方向出现超级产品市场匹配度(PMF) [16] - **核心竞争要素转变**:大模型竞争核心已从模型参数、对话能力转向Agent适配性和商业化效率 [8] - **稳定服务至关重要**:OpenClaw热潮警示模型公司,除了顶尖的模型能力(SOTA),稳定的算力和Token服务同样不可或缺 [20] - **长期红利归属**:最终能留住用户并吃到长期红利的,仍将取决于模型能力本身,而国产模型被认为仍在追赶国外顶级模型的路上 [23]
一只龙虾,成了MiniMax、月暗、智谱的财神爷
创业邦· 2026-03-03 18:09
文章核心观点 - 2026年初,AI智能体工具OpenClaw的爆火引发了一场全球性的Token消耗热潮,这从根本上改变了AI大模型行业的竞争格局和商业模式 [6] - 中国AI模型公司(如MiniMax、月之暗面、智谱AI)凭借其模型在多模态、稳定性,特别是极高的性价比优势,成为这波Token消耗盛宴中的最大受益方,实现了市值、收入和融资的飞跃 [7][9] - 行业竞争的核心已从模型参数和对话能力,转向对Agent(智能体)的适配性和商业化效率,这成为中国AI挑战全球竞争的新支点 [9] - OpenClaw作为“Token黑洞”创造了巨大的增量市场,但也对模型公司的算力供给和运营稳定性提出了严峻挑战,实力雄厚的云厂商正加速入场 [14][18][19] OpenClaw引发的市场热潮与影响 - **现象级产品**:OpenClaw在GitHub上星标接近25万,成为史上最受欢迎的开源项目,其火爆催生了从本地部署到云端服务的新生意 [9][10] - **颠覆性使用模式**:OpenClaw作为桌面级Agent工具,能通过自然语言接口自主执行复杂任务,具有记忆和持续进化能力,改变了人机交互方式,从“使用工具”变为“培养员工” [10][11][21] - **创造巨额Token需求**:OpenClaw因需持续在后台运行流程,导致Token消耗量巨大,例如有用户生成一个2000字文档就消耗700万Token,做爬虫测试消耗2900万Token,甚至有人单日消耗5000万Token [15] - **企业级应用与投入**:企业开始要求员工使用并给予Token补贴,例如有公司给普通员工每天150元、技术团队每天1000元的消耗补贴;个人用户如猎豹移动CEO傅盛每天花费超100美元,10天内交互22万字 [11][13] 中国模型厂商的崛起与表现 - **市场份额领先**:在OpenClaw生态带动下,中国模型在全球Token消耗中占据主导。2026年2月24日当周,OpenRouter平台前十名模型总Token消耗约8.7万亿,中国模型独占5.3万亿,占比61% [9] - **调用量霸榜**:2026年2月,MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5等模型在OpenRouter周榜上轮流占据前五席位,其中MiniMax M2.5的调用量连续三周位列第一 [6] - **市值与收入飙升**:MiniMax、智谱AI在港股市值双双突破3000亿港元;月之暗面K2.5模型发布后近20天,其API收入超过2025年全年总和,并在一多月内完成两轮累计超12亿美元融资,估值翻倍至100亿美元以上 [7] - **性价比优势显著**:中国模型凭借极高性价比吸引全球开发者。例如,MiniMax M2.5模型海外定价为每百万Token输出2.4美元,而Anthropic的Claude Sonnet 4.6为15美元,价差高达6倍 [15] 模型厂商的战略响应与竞争 - **加速与OpenClaw融合**:各厂商迅速推出自有部署工具以抓住机遇。月之暗面于2月18日上线“Kimi Claw”,高级版月费至少199元;MiniMax于2月26日上线“MaxClaw”,其服务器在120小时内紧急扩容四次 [13] - **Token消耗量激增**:MiniMax财报显示,其M2系列文本模型在2026年2月的单日Token消耗量已增长至2025年12月的超6倍,其中编程套餐(Coding Plan)的Token消耗量增长超过10倍 [16] - **算力挑战凸显**:流量暴涨对算力构成压力。智谱AI的GLM-5因服务出现排队、延迟,尽管多次扩容并限量发售套餐,仍导致其股价在2月23日一度下跌22%,单日蒸发1000多亿港元,并暂时跌出OpenRouter榜单前九 [16][17] - **大厂加速入场**:阿里、腾讯、百度等云厂商积极布局。百度智能云上线OpenClaw一键部署服务;腾讯内测“WorkBuddy”桌面工作台;阿里推出开源桌面Agent工具“CoPaw”并集成多种模型 [19][20] 行业趋势与未来展望 - **长期趋势开端**:MiniMax CEO闫俊杰认为当前增长是长期趋势的开端,Token消耗将在三个方向实现超级产品市场匹配:编程、办公Agent和动态生成长内容 [16] - **竞争维度转变**:行业竞争核心已从模型参数、对话能力转向Agent适配性与商业化效率,稳定可靠的算力和Token服务变得与模型尖端能力同等重要 [9][18] - **市场格局未定**:尽管OpenClaw带来热潮,但最终能留存用户并吃到长期红利取决于模型能力,国产模型被认为仍在追赶国外顶级模型的路上 [21]
当Token成为新石油:恒生科技指数,正在变成全球大模型的“算力定价权”
美股研究社· 2026-02-28 19:38
AI产业价值锚点迁移 - AI产业的价值锚点正从“供给侧的算力垄断”向“需求侧的Token消耗”迁移 [3] - 资本市场对AI的叙事正从“算力即权力”转向关注“Token消耗”这一真实需求指标 [2][9] Token价格与成本革命 - 中国大模型在调用量上实现反超,单周调用量达5.16万亿Token,高于美国的2.7万亿Token [5] - 中美大模型存在巨大的“价格断层”:输入端每百万Token价格,中国模型平均为0.3美元,美国主流模型为5美元;输出端价差更悬殊,为1.1美元对25美元,价差达16倍至22倍 [6] - 价格差异源于不同的技术路线:美国依赖顶尖硬件(如H100/B200芯片)追求极致性能;中国在算力受限下进行极致的工程优化,压榨出更高的Token产出率 [6] - 当模型能力差距从“三年”压缩到“七个月”,而价格仅为五分之一甚至二十分之一时,商业逻辑发生翻转,企业更倾向于选择“可负担的规模部署” [7] 资本市场反应与估值逻辑转变 - 市场出现即时反应:英伟达(NVIDIA)股价下跌5%,市场担忧其“算力垄断溢价”遭遇挑战 [7] - 腾讯(Tencent)与阿里巴巴(Alibaba Group)股价反弹3%,其低价策略带来的流量入口价值被重估 [7] - 估值逻辑正从“算力瓶颈”转向“调用规模”,定价权开始从硬件制造商向平台运营商转移 [9] - 大模型行业的利润池可能从“训练端”转移到“调用端”,类似互联网历史中利润从网络设备商(如思科)向用户入口平台(如谷歌、Meta)转移的过程 [19] 恒生科技指数成为“Token晴雨表” - 恒生科技指数正从“政策博弈的战场”演变为全球大模型的“Token晴雨表” [3] - 与纳斯达克指数(代表“AI的生产者”和算力硬件)不同,恒生科技指数更代表模型应用、调用规模与终端分发能力 [13][14][15] - 中国大模型的爆发式增长主要承载在港股上市的科技平台(如腾讯、阿里巴巴、百度),这些平台连接着丰富的商业场景(社交、电商、搜索等) [15] - 恒生科技指数可能从“政策贝塔指数”转变为“全球AI使用强度指数”,反映AI技术在真实商业场景中的渗透率 [16][17] 低价策略引发的规模效应与行业影响 - 中国模型的价格优势可能引发Token消费的指数级膨胀,经济学中的价格弹性理论适用:单位成本下降90%,调用量可能增长数倍而非50% [17] - 低价使AI从“奢侈品”变为“日用品”,打破企业使用心理门槛 [17] - 当全球开发者发现调用中国模型的API成本仅为美国的十分之一且效果满足需求时,流量将不可逆转地向低成本平台倾斜 [17] - 平台端的Token消耗不仅是成本,更是连接用户、沉淀数据、优化模型的燃料,消耗越多,生态壁垒越厚 [20] 投资视角下的价值链重估 - 硬件端:面临高景气但边际风险提升,有产能过剩与价格战压力 [21] - 模型端:能力差距缩小,竞争加剧,纯模型厂商的独立生存空间被压缩 [21] - 平台端:调用量决定长期现金流,拥有场景的公司将享受“Token税” [21] - 未来的赢家不属于拥有最多显卡的,而属于让Token流动最频繁、控制最大流量入口的公司 [21][24] - 恒生科技指数的反弹可能不仅是情绪修复,而是“全球大模型价值链重估”的前奏 [21] AI产业的范式转移 - AI产业的衡量标准正从“算力供给”(如FLOPS)迁移到“Token消耗” [23] - 这类似于电力革命从关注发电机功率到关注电器普及率与用电量的转变 [23] - 如果GPU决定了上一个周期的指数结构,那么Token可能决定下一个周期的指数方向 [24]
春节AI大战只是表象?摩根大通:token消耗量将进入高速增长期,五年或增长370倍!
华尔街见闻· 2026-02-10 22:05
核心观点 - 春节期间的AI应用推广战本质是用户习惯从传统搜索向聊天机器人迁移 这将推动AI推理Token消耗量进入一个长达多年的高速增长期 [1] - 投资焦点应放在更具确定性的“二阶赢家” 包括直接受益的AI基础设施商及具有网络广告业务敞口的公司 [1][2] 行业趋势:用户习惯与Token消耗 - 消费者获取信息和消费内容的方式正在发生结构性改变 各大科技平台投入资金推广旨在加速用户从传统搜索转向聊天机器人并培养智能体商业习惯 这一进程推升了推理量 从而加快了Token的消耗速度 [1] - 预测2025年至2030年 中国Token消耗量的年复合增长率将高达330%左右 [2] - 中国的AI推理Token消耗量预计将从2025年的约10千万亿 增长至2030年的约3,900千万亿 五年间增长约370倍 [5] - 截至2025年12月 字节跳动豆包系列模型的日均Token消耗量已突破50万亿 同比增长超10倍 [5] 驱动因素与结构变化 - Token消耗量爆发式增长主要由两个因素驱动:一是AI在消费者和企业工作负载中的渗透率提高 二是应用场景从简单的对话AI扩展到复杂的智能体和多模态输出 [5] - 推理需求的构成将发生显著变化 对话AI占总消耗量的比例预计将从2025年的近一半下降至2030年的高个位数 [5] - “知识工作者AI智能体”因涉及多步骤推理和文档工作流 预计到2030年将占总消耗量的三分之一 [5] - “多模态AI”随着图片、音频和视频工作负载的增加 份额将从目前的15%增长至接近40% [5] - Token增长并不线性等同于芯片需求增长 新一代硬件带来的推理性能提升以及软件堆栈优化 使每GPU小时处理的Token量也在显著改善 [6] 公司策略分析 - **腾讯**:采取“增长优先”策略 投入10亿元人民币开展红包活动 利用微信社交轨道降低用户门槛以扩大“元宝”安装量和激活量 [3] - **阿里巴巴**:策略展现出结构性差异 宣布30亿元人民币的“春节请客计划” 目标不仅是提高“通义千问”采用率 更是培养“从AI界面发起交易”的智能体商业习惯 以缩短消费漏斗并提高转化效率 [3][4] - **百度**:投入约5亿元人民币 坚持“AI助手+搜索分发”的综合战略 试图将AI嵌入意图更强的搜索会话中 [4] - **字节跳动**:虽未公布大规模现金补贴 但凭借产品迭代和抖音等生态入口的分发能力 其豆包系列模型日活用户据报道已达到1亿 [4] 投资主题与机会 - 目前判断AI应用端的胜负为时尚早 更具确定性的投资机会在于“二阶赢家” [2] - “二阶赢家”包括中国AI基础设施的直接受益者 如阿里巴巴和百度 以及具有网络广告业务敞口的公司 如快手 [2] - 中国AI基建已成为TMT领域最具吸引力的投资主题之一 [2]
小摩: 目前断定AI应用市场最终赢家为时过早 偏好阿里巴巴-W(09988)等
智通财经网· 2026-02-09 15:41
行业趋势与投资主题 - 消费者行为转变,聊天机器人正成为信息搜寻、内容推荐和任务执行的新“起点” [1] - 大型互联网平台正投入真正的营销资金以加速AI采用,这将机械性地提高推理量并推动Token消耗快速增长 [1] - 中国的Token消耗在2025年至2030年间的年复合增长率预计将达到约330% [1] - GPU计算能力的供不应求状况预计在未来几年内仍会持续 [1] - 中国的AI基础设施被视为中国TMT覆盖范围内最具吸引力的投资主题之一 [1] 受益公司分析 - 更青睐中国AI基础设施受益者,如阿里巴巴-W(09988)和百度集团-SW(09888) [1] - 线上广告受益者快手-W(01024)被视为二级赢家 [1] - 目前判断持久的AI应用赢家与输家还为时过早 [1] 腾讯控股(00700)具体观点 - 市场对腾讯AI产品推进势头比某些同业更谨慎的担忧,已很大程度反映在股价中 [2] - 腾讯当前交易估值为2026年预测市盈率的15倍,仅比历史低点高约25% [2] - 腾讯的核心盈利展望仍然稳健 [2] - 腾讯最持久的资产是其分发和参与度,这种能力会随时间复利增长,并使包括AI在内的新能力能以比同行更低的用户获取成本实现规模化 [2] - AI对腾讯而言是一个重要的上行选项,其优势在于将AI嵌入高频应用场景(如搜索、内容和小程序工作流程)以推动变现,而无需在前沿模型竞赛中获胜 [2] - 建议逢低买入腾讯 [2]