Workflow
Token
icon
搜索文档
2月井喷!中国AI调用量首超美国,四款大模型霸榜全球前五,国产算力需求正经历指数级增长
每日经济新闻· 2026-02-26 19:35
全球AI模型调用量格局剧变 - 2026年2月9日至15日当周,中国AI模型的Token调用量达到4.12万亿,首次超过同期美国模型的2.94万亿,实现历史性赶超[8][9] - 次周(2月16日至22日),中国模型调用量进一步冲高至5.16万亿Token,三周内增长127%,而同期美国模型调用量降至2.7万亿Token[2][9] - 全球最大的AI模型API聚合平台OpenRouter数据显示,其前十大模型的周调用量从2025年3月初的1.24万亿Token飙升至2026年2月中旬的13.95万亿Token,不到一年增长超过10倍[8] 中国模型集群式崛起与市场主导 - 在2026年2月16日至22日的周榜单中,全球调用量排名前五的模型中有四款来自中国,分别为MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5以及DeepSeek的V3.2,这四款模型合计贡献了Top5总调用量的85.7%[12] - 中国模型的增长动能并非依赖单一产品,而是厂商集群式崛起[2][9] - 在OpenRouter平台用户以海外开发者为主(美国占47.17%,中国仅占6.01%)的背景下,此数据客观反映了中国AI模型在全球范围内的真实吸引力[5] 领先模型表现与市场格局 - MiniMax的M2.5模型于2026年2月13日发布,上线不足一周便登顶周调用量榜首,在2月9日至15日当周平台总调用量激增的3.21万亿Token中,仅M2.5一款模型就贡献了1.44万亿Token增量[12] - 月之暗面的Kimi K2.5模型能调度多达100个“Agent分身”并行工作,将复杂任务处理效率提升3到10倍,发布后不到一个月的累计收入已超过其2025年全年总收入[15] - 根据a16z与OpenRouter的联合报告,过去一年DeepSeek全系列模型总Token调用量以14.37万亿位居全球第一,阿里千问全系列以5.59万亿位居第二[15] - 在中国大模型B端市场,2025年下半年千问(Qwen)系列模型的日均Token调用量占比为32.1%,位列第一,相比上半年(17.7%)几乎翻倍[16] 显著的成本竞争优势 - 中国模型具备极强的成本优势,以OpenRouter平台价格为例,在输入环节,MiniMax M2.5与智谱GLM-5的价格均为0.3美元/百万Token,而海外对标产品Claude Opus4.6为5美元/百万Token,是前者的约16.7倍[18] - 在输出环节,成本差异更为悬殊:MiniMax M2.5为1.1美元/百万Token,智谱GLM-5为2.55美元/百万Token,而Claude Opus4.6高达25美元/百万Token,分别是前两者的约22.7倍和9.8倍[18] - 中国模型在多个基准测试中表现比肩甚至超越国际顶尖模型,如MiniMax M2.5在SWE-Bench Verified测试中得分为0.802,与Claude Opus4.6的0.808相近[19] 技术架构创新驱动降本增效 - 以“混合专家”(MoE)架构为代表的技术路线是中国模型能够大幅降低推理成本的核心原因之一,DeepSeek、阿里巴巴的通义千问3.5-Plus等模型已广泛采用该架构[20] - MoE架构通过“按需激活”专家网络,相较于传统稠密模型,能极大减少计算量和硬件资源需求,数据显示采用MoE架构可直接让推理时显存占用降低60%,推理吞吐量提升高达19倍[20] - 中国AI厂商积极探索“垂直整合”路径,将模型算法、云计算基础设施和AI芯片进行深度一体化协同设计与优化,以极致算力调度算法实现硬件资源最高效利用,进一步降低基础设施成本[21] Token消耗增长驱动与商业模式演进 - 摩根大通预测,从2025年到2030年,中国Token消耗量的年复合增长率将达到惊人的330%,在5年间实现370倍的增长[21] - AI角色正从“问答工具”进化为“生产力工具”,用户核心需求从浅层“问答”转向深度“干活”,导致“Token通胀”,即单位用户Token消耗结构性上升[22] - AI Agent技术的兴起和普及,以及推理强度的上升,进一步放大了Token的消耗[22] - AI服务商业模式正从“按量计费”向“燃料+成果”混合模式演进,未来定价将走向高度定制化和灵活化,形成多维度、动态的定价体系[23][24] 产业生态与全球影响 - 产业市场形成由多家头部企业构成的“AI中国团”宽广技术产业群落,有利于竞争创新和人才生态建设,并在中美AI竞争中形成集群优势[17] - 知名风投机构a16z的合伙人观察到,在硅谷寻求融资的AI初创公司中,其路演核心模型高达80%使用中国的开源模型[17] - Token正从互联网“流量”转变为AI时代执行生产任务必不可少的“燃料”,推理性能直接决定客户的收入能力[23]
全球资本开支创下新高之际,英伟达再迎季度业绩纪录
新浪财经· 2026-02-26 07:21
公司财务业绩 - 最新季度营收达680亿美元,同比增长73% [2] - 最新季度数据中心业务收入为620亿美元,其中510亿美元来自算力收入(主要为GPU),110亿美元来自网络产品收入(如NVLink) [2] - 公司全年营收达2150亿美元 [2] - 最新季度利润再创纪录 [2] 市场需求与行业动态 - 全球对AI算力(Token)的需求呈现完全的指数级增长 [2] - 云端里六年前的GPU都已被完全耗尽,价格也在上涨 [2] - 在AI新时代,算力就是收入,没有算力就无法生成Token,没有Token就无法实现收入增长 [3] - 行业已经来到拐点,正在产生能为客户创造生产力和为云服务商带来利润的有价值Token [3] 业务与客户合作 - 公司正与OpenAI推进合作协议,并相信已接近达成 [3] - 公司还提到了与Anthropic、Meta以及埃隆・马斯克的xAI的合作 [3] - 公司拟对OpenAI进行投资,据报道该投资规模达300亿美元 [2] - 公司向美国证券交易委员会提交的文件强调,无法保证最终会完成对OpenAI的这笔投资 [3] 地缘政治与市场准入 - 尽管美国政府近期放宽了出口限制,英伟达仍未录得任何对华芯片出口收入 [2] - 美国政府已批准少量面向中国客户的H200产品,但尚未产生任何收入 [2]
2026年AIDC展望:国内外共振,电源液冷有望迎来爆发式增长
2026-02-24 22:16
**行业与公司** * **行业**: AIDC (AI数据中心) 硬件,具体包括液冷散热、电源设备(UPS/PSU/HVDC)等细分领域[1][3][11][12][17] * **涉及公司**: * **液冷**: 英维克、申菱环境、科创新源、捷邦科技、奕东电子、兴瑞科技、飞龙股份、大元泵业[9][10][11] * **电源**: 麦格米特、阳光电源、欧陆通、瑞能技术、优优绿能、中恒电气[19][22][23][24] * **产业链其他公司**: 维谛、台达、伊顿、施耐德、AVC、Koolmaster、丹佛斯、史陶比尔等[2][4][7][10][19] **核心观点与论据** **1. 行业需求:Token爆炸驱动算力需求,全球AIDC投资高景气** * **需求端驱动力**: 多模态模型(如OpenChrome、Gemini、C-Dance、C-Dream)的普及导致**Token消耗量爆炸式增长**,且用户付费意愿提升[2] * **价格趋势**: **每百万Token的价格持续上涨**,北美地区算力短缺趋势明显[2] * **全球投资预测**: * **北美**: 头部4家云厂商(四姐妹)到2026年的资本开支预计达到**6000亿美金**,相比2025年接近**翻倍**增长[15] * **中国**: 预计有**40%-50%** 的增速[15] * **全球分布**: 全球IT装机量约**200GW**,其中北美占**50%-60%**,东南亚增速达**50%**,中东有**30GW**计划,欧洲有**40-50GW**计划[16] * **中国模型公司崛起**: 在AI模型排名中,中国公司表现亮眼(如MinyMax、Kimi、智谱),将带动国内AI硬件供应链需求[13][14] **2. 液冷散热:量价齐升,技术迭代带来结构性机会** * **需求爆发式增长**: * 2025年,预计NV系机柜内液冷设备(冷板、快接头等)出货约**70万套**[3] * 2026年,预计GPU/CPU/TPU对应的**冷板总需求达500-700万套**,相比2024年有**近10倍增量**[4] * 当前台湾主流供应商(AVC、Koolmaster、台达)产能严重不足,预计仅能满足全球需求的**50%-60%**,将依赖中国大陆新增供应商[4][7] * **技术迭代与价值量提升**: * **功率提升**: 下一代Rubin架构单柜功率可能提升至**400千瓦**,Ultra可能达**500-600千瓦**[5] * **散热范围扩大**: 交换机、光模块将从风冷转为液冷,增加冷板用量[5] * **设计复杂化**: Rubin可能采用托盘式整体设计,支持液冷和电源快速更换,提升设计难度和价值量[5] * **微通道技术**: 可能成为主流,其加工难度可使冷板价值量再有**40%-50%** 的提升空间[6] * **综合影响**: 机柜功率密度提升可能使**液冷系统价值量翻番**[6] * **投资机会**: * **柜内设备**: * **Tier 1龙头**: 推荐**英维克**,作为英伟达主要一供,且在Google、Meta等CSP客户处不断突破[9][10] * **Tier 2供应商**: 推荐冷板代工(科创新源、捷邦科技、奕东电子)和快接头(兴瑞科技)等公司,预计2026年需求将释放[9] * **柜外设备**: * **CDU(冷却分配单元)**: 价值量高,需求随IDC放量而增长。推荐**英维克、申菱环境**,因维谛、伊顿等现有厂商产能扩张跟不上需求[10][11] * **电子泵**: 明确的价值提升环节,建议关注飞龙股份、大元泵业[11] **3. 电源设备:技术路线变革与出海机遇并存** * **技术迭代趋势**: * **柜内PSU(电源单元)**: 功率从**5.5千瓦**向**12千瓦**乃至Rubin架构的**19千瓦**升级[17] * **柜外供电**: **HVDC(高压直流)取代UPS(不间断电源)** 趋势明确[17] * Google因采用超节点方案训练,要求更高电力集群,采用**400伏**方案[18] * 英伟达从Rubin系列开始,将硬性要求采用**800伏**的HVDC架构[18] * **市场机遇**: * **海外需求强劲**: 海外AI硬件因Token定价更高(国内1亿Tokens约80元,海外约**640元**,为国内8倍),需求及溢价更高[14][15] * **电力缺口持续**: 海外(尤其东南亚、中东)电力缺口持续,燃机排单已到**2029年**,为电源设备带来机会[16] * **国内需求起量**: 中国模型公司Token消耗量增长,将带动国内AIDC装机量在**2025年第二、三季度起量**[24] * **投资观点与标的**: * **投资逻辑转变**: 2026年需从交易预期转向寻找**业绩确定性高、能季度兑现**的公司[18] * **系统解决方案商**: * **麦格米特**: 逻辑持续强化。预计Q1通过施耐德等渠道出货,带来约**3亿收入**兑现。在C3卡技术路径下,可能联合维谛、伊顿、施耐德开发产品,其PSU份额**有望超过20%**,对应千亿市值空间,若进入iFace环节可达两千亿[19][20] * **阳光电源**: 短期利好较多,包括3月参加美国GTC大会发布新品、4-5月港股上市可能释放利好(如与亚马逊、谷歌的储能订单)。长期看,AIDC配储业务到2026年可能贡献**100亿甚至200亿利润**[21][22] * **HVDC环节**: * 推荐**瑞能技术**(在越南有工厂,从UPS代工转向HVDC,海外合作有实质进展)、**优优绿能**(成立AIDC子公司布局电源产品)、**中恒电气**(受益于国内推理需求起量及出海)[22][23][24] * **国内配套**: * 推荐**欧陆通**,受益于国内装机起量,且下半年可能对Google有小批量或批量交付[24] **其他重要信息** * **会议背景**: 此为国泰海通电新团队“春节不打烊”系列电话会之一,聚焦AIDC硬件端投资机会,当晚另有卫星载荷(太空算力、太阳翼)主题会议[1] * **市场情绪**: 市场对算力投资持续性存在质疑和争议,但分析师认为从长期看增长天花板远未到来[1][2] * **合规提示**: 部分内容因时间及合规原因未详细展开,建议感兴趣的投资人进行一对一交流[11]
产品涨价、股价飙升,中国AI大模型龙头“爆”了
每日经济新闻· 2026-02-22 21:45
市场表现与市值 - 2026年2月20日港股马年首个交易日,智谱股价收涨42.72%,报725港元/股,单日市值增长超过967亿港元,总市值突破3232亿港元 [1][3] - 同日,MiniMax股价收涨14.52%,报970港元/股,市值达3042亿港元 [1][3] - 自上市以来,智谱累计涨幅达523%,MiniMax累计涨幅达487.88% [1][8] - 2月以来,智谱股价累计涨幅超过220%,MiniMax在2月累涨超105% [1][3] - 两家公司市值已超越快手(2894亿港元)和携程(2867亿港元),逼近泡泡玛特(3279亿港元)与百度(3548亿港元) [2][11] 技术与产品突破 - 2026年2月12日,智谱开源发布新一代旗舰模型GLM-5,标志大模型编程进入“智能体工程时代” [13] - GLM-5在编程开发场景中平均性能较上一代提升超20%,真实编程体验逼近Claude Opus 4.5水平,并在多项Agent评测中取得开源领域最优表现 [13] - 因供不应求,智谱在发布GLM-5后上调GLM Coding Plan套餐价格,其中国区涨价30%,海外版涨价超100%,新套餐上线即售罄 [14] - 同日,MiniMax发布面向Agent场景原生设计的生产级模型M2.5,支持全栈编程开发 [14] - M2.5在公开基准测试中多项核心指标达到或刷新行业SOTA水平,包括SWE-Bench Verified(80.2%)、Multi-SWE-Bench(51.3%)和BrowseComp(76.3%) [14] - 相比上一代M2.1,M2.5在SWE-Bench Verified测试中完成任务的速度提升了37%,更适配长链路Agentic任务 [14] 成本优势与市场采用 - 在编程任务上,MiniMax能以接近头部闭源模型5%的成本,实现近似的效果 [15] - 根据OpenRouter数据,MiniMax M2.5与智谱GLM-5的输入价格均为0.3美元/百万Token,显著低于Claude Opus 4.6的5美元/百万Token [15] - 输出环节,MiniMax M2.5价格为1.1美元/百万Token,GLM-5为2.55美元/百万Token,Claude Opus 4.6则高达25美元/百万Token [15] - OpenRouter最新数据显示,MiniMax M2.5是本周调用量最大的模型,调用量达3.07T tokens,环比增长524% [16] - GLM 5调用量达1.03T tokens,排名第三,环比增长462% [16] 财务与估值状况 - 2022年至2025年上半年,智谱累计亏损总额高达62.38亿元 [18] - 2025年前九个月,MiniMax营收同比增长174.76%至5344万美元,但净亏损达5.12亿美元(约合人民币36.05亿元) [18] - 两家公司的市销率(PS)超过700倍,远高于OpenAI的65倍(按8500亿美元估值及2025年130亿美元收入计算) [2][19] - 智谱最新估值约413亿美元(3232亿港元),MiniMax最新估值约389亿美元(3042亿港元) [19] - 智谱2025年上半年收入为1.91亿元,MiniMax 2025年前9个月营收为5344万美元 [19] 行业趋势与市场观点 - 专家观点认为,资本市场对大厂以外的“小虎”的信任度和价值预期比原来更高 [12] - 大模型时代的Token正从“流量”转变为执行生产任务必不可少的“燃料”,Token消耗在越来越多场景里是刚需 [19] - 当AI角色从“问答”变为实际“干活”时,Token消耗量会急剧增加,在Agent兴起下被进一步放大,一个复杂任务可能需要调用模型数十甚至数百次 [20] - 市场预期,未来一个用户背后可能同时运行多个Agent,一个Agent一天的Token消耗量可能达千万级别 [20] - 大模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流,并在高ROI场景中维持订阅留存时,具备穿越价格战的能力 [20] 竞争格局与挑战 - 全球大模型初创公司估值排名中,OpenAI以8500亿美元估值领先,其次是Anthropic(3800亿美元)和xAI(2500亿美元) [19] - MiniMax超过70%的收入来自海外,主要产品Talkie在海外的用户粘性和付费转化率尚未得到长期验证 [21] - 智谱的编程模型面临来自Claude、Gemini、GPT等全球顶尖产品的激烈竞争,其定价权能维持多久仍是未知数 [21] - 港股AI标的稀缺性放大了估值溢价,智谱和MiniMax作为为数不多的纯大模型标的,承接了大量寻求AI投资出口的资金 [21]
产品涨价、股价飙升,中国AI大模型龙头“爆”了!
每日经济新闻· 2026-02-22 21:05
公司股价与市值表现 - 智谱在2月20日(港股马年首个交易日)收涨42.72%,报725港元/股,单日市值增长超过967亿港元,总市值突破3232亿港元 [1][2] - MiniMax在2月20日收涨14.52%,报970港元/股,市值达3042亿港元 [2] - 自上市以来,智谱累计涨幅达523%,MiniMax累计涨幅达487.88% [1][7] - 2月以来,智谱股价累计涨幅超过220%,MiniMax在2月累涨超105% [1][2] - 两家公司市值已超越快手(2894亿港元)和携程(2867亿港元),逼近泡泡玛特(3279亿港元)与百度(3548亿港元) [2][10] 公司财务与估值状况 - 智谱在2022年至2025年上半年累计亏损总额达62.38亿元人民币 [17] - MiniMax在2025年前九个月营收为5344万美元,同比增长174.76%,但净亏损达5.12亿美元(约合36.05亿元人民币) [17] - 两家公司的市销率(PS)超过700倍,远高于OpenAI的65倍(按8500亿美元估值及2025年130亿美元收入计算) [2][17] - 智谱最新估值约413亿美元(3232亿港元),MiniMax最新估值约389亿美元(3042亿港元) [18] 技术与产品突破 - 智谱于2月12日开源发布新一代旗舰模型GLM-5,标志大模型编程进入“智能体工程时代” [12] - GLM-5在编程开发场景中平均性能较上一代提升超20%,真实编程体验逼近Claude Opus 4.5水平 [12] - GLM-5在BrowseComp、MCP-Atlas和τ2-Bench三项Agent评测中取得开源领域最优表现 [12] - MiniMax于同日发布面向Agent场景原生设计的生产级模型M2.5,支持全栈编程开发 [12] - M2.5在SWE-Bench Verified测试中达到80.2%,在Multi-SWE-Bench测试中达51.3%,在BrowseComp测试中达76.3% [13] - 相比上一代M2.1,M2.5在SWE-Bench Verified测试中完成任务速度提升37% [13] 市场反响与商业化进展 - GLM-5发布后供不应求,智谱隔日上调GLM Coding Plan套餐价格,其中国区涨价30%,海外版涨价超100% [12] - 新套餐上线即售罄,创下国产AI编程模型付费套餐售空纪录 [12] - 根据OpenRouter数据,MiniMax M2.5是本周调用量最大的模型,调用量达3.07T tokens,环比增长524% [15][16] - GLM-5调用量达1.03T tokens,环比增长462%,排名第三 [15][16] - 在编程任务上,MiniMax能以接近头部闭源模型5%的成本实现近似效果 [13] 成本优势与行业对比 - 在输入环节,MiniMax M2.5与GLM-5价格均为0.3美元/百万Token,而Claude Opus 4.6为5美元/百万Token,是前两者的约16.7倍 [14] - 在输出环节,MiniMax M2.5价格为1.1美元/百万Token,GLM-5为2.55美元/百万Token,Claude Opus 4.6为25美元/百万Token,分别是MiniMax M2.5的约22.7倍和GLM-5的约9.8倍 [14] - OpenAI最新估值8500亿美元,2025年年化收入不少于200亿美元 [18] - Anthropic最新估值3800亿美元,2025年年化收入140亿美元 [18] 行业趋势与市场逻辑 - 大模型时代的Token正从“流量”转变为执行生产任务必不可少的“燃料”,其消耗在越来越多场景里是刚需 [19] - 当AI从“问答”变为实际“干活”(如重构代码、生成文档),其Token消耗量会急剧增加 [19] - Agent的兴起放大这一转变,复杂任务可能需要调用模型数十甚至数百次,市场预期一个Agent一天的Token消耗量可能达千万级别 [19] - 大模型厂商有机会把“算力稀缺”通过分层定价与订阅化产品转化为毛利与现金流 [19] - 资本市场对大厂以外的“小虎”的信任度和价值预期比原来更高 [11][18] - 智谱与MiniMax在技术研发、产品服务、应用市场、资本市场四个维度形成了闭环 [18] 公司业务与市场构成 - MiniMax超过70%的收入来自海外,其主要产品Talkie在海外的用户粘性和付费转化率尚未得到长期验证 [20] - 智谱的编程模型面临来自Claude、Gemini、GPT等全球顶尖产品的激烈竞争 [20] - 作为港股市场为数不多的纯大模型标的,智谱和MiniMax承接了大量寻求AI投资出口的资金,稀缺性放大了估值溢价 [20]
未知机构:申万互联网传媒计算机国内海外云均涨价Agent和多模态需求推高重视卖水-20260213
未知机构· 2026-02-13 10:30
纪要涉及的行业或公司 * **行业**: 云计算行业、人工智能行业(特别是Agent和多模态AI应用)[1] * **公司**: 海外云厂商(AWS、谷歌云)[1];国内云厂商(优刻得、金山云、百度集团、阿里巴巴、腾讯控股)[1][2][4] 核心观点和论据 * **云服务出现涨价趋势**: 海外AWS、谷歌云近期上调部分产品价格[1];国内优刻得等云厂商也陆续涨价[2] * **涨价原因分析**: 此次涨价反映了上游硬件成本上涨的传导[3];同时确认了下游需求强劲[3] * **下游需求驱动力**: Agent(如高热度延续的OpenClaw/Clawdbot)推动了对高效Agent的需求,进而加速了Token的消耗[3];多模态AI应用(如Seedance2.0)的普及将进一步加速Token消耗的增长[3] * **对云计算厂商的影响**: 更高的Token消耗意味着更多的云计算资源使用,云厂商将确定性收益[3] * **投资机会**: 重视作为“卖水人”的国内云厂商的投资机会[1] 其他重要内容(相关标的) * **金山云**: 被列为小米金山系核心云厂,具有高弹性,近期被重点推荐[4] * **百度集团**: 具备全栈AI能力,并控股芯片公司昆仑芯[4] * **阿里巴巴**: 是国内云厂商领军者,具备全栈AI强技术能力,其平头哥自研芯片具有成本优势[4] * **腾讯控股**: 腾讯云预计在2025年扭亏为盈,采取差异化竞争策略,其类SaaS产品贡献了约四分之一的收入[4]
重视token的巨大需求
2026-02-11 13:58
行业与公司概览 * **涉及的行业**:人工智能(AI)、云计算、软件与SaaS、算力芯片、数据中心(IDC)、AI视频制作[1][5][7][12][18][19] * **涉及的公司**: * **云厂商**:阿里云、腾讯云[3][5][16] * **AI大模型/工具**:CloudBot(Open Cloud)、Mindspore、C-DAS 2.0、字节跳动(豆包)、阿里(千问)、Deepseek[1][2][12][14][16] * **基础设施/算力**:网速(NetSpeed)、海光、寒武纪[3][16][20] * **AI视频**:兆驰股份、万兴科技[3][18] * **IDC厂商**:东阳光、润泽(字节链)、世纪互联数据港(阿里链)、科华数据(腾讯链)[3][19] * **软件/SaaS**:A股软件公司、Salesforce(美国)[8][11] 核心观点与论据 **1. 大模型技术趋势:从对话到工具调用,驱动巨大算力与Token消耗** * **角色演变**:大模型正从交互式对话工具演变为任务工具调用方,例如CloudBot允许用户自由选择模型和API以提供定制化服务[1][2] * **Token消耗巨大**:高频调用工具导致Token消耗量剧增,例如使用Open Cloud CloudBot一周可能消耗**一两千万个Token**,仅文字交互下一分钟也可能消耗**几万Token**[1][3][4][13] * **多模态加剧需求**:如C-DAS 2.0等多模态输入处理模型,能同时处理视频、音频、图片,对算力和Token的消耗量**极其巨大**,进一步推高需求[1][12] **2. 云厂商在AI时代的重要性与话语权提升** * **关键角色**:云厂商通过提供镜像化服务(如租用腾讯云服务器每月**30元**)降低用户使用门槛,并决定可调用的大模型,掌握生态话语权[1][5] * **重要性递增**:随着多模态模型发展和Token消耗激增,云厂商在提供高效算力支持方面将**变得越来越重要**[12] **3. AI技术对软件/SaaS行业的冲击与重塑** * **削弱入口价值**:AI技术(如Cloudbot)能调用多种工具完成任务,减少对单一软件入口的依赖,正在消解标准化软件产品和订阅制SaaS公司的入口价值[1][7][9][10] * **中美差异显著**:中国计算机软件行业约**500家**上市公司中,真正的SaaS公司**屈指可数**;而美国软件公司(如Salesforce)擅长构建包含**几千个工具**的成熟生态系统[8] * **A股软件公司的互补优势**:A股软件公司多专注于定制化开发和垂直领域服务,其行业know-how与流程性理解能与通用型大模型形成**互补**,是AI技术的良好合作伙伴[1][11] **4. 潜在风险与挑战** * **插件安全风险**:市场Skills(技能)鱼龙混杂,存在伪装成技能的恶意软件(如用于挖矿),可能导致服务器资源被大量占用[1][6] * **响应延迟问题**:Cloudbot等工具响应时间较长(需**至少3分钟以上**),而其他大模型如豆包等可在**10秒至20秒**内响应,存在明显的推理和返回延迟,加速需求迫切[16] **5. 大模型商业化与市场前景** * **收费成为常态**:由于算力需求巨大,大模型产品(如字节跳动的C-DAS 2.0)已开始收费[13][14] * **收入前景广阔**:中国大厂如字节跳动、阿里巴巴预计**2026年**的Token消耗量目标将**翻10倍**,未来大模型收费收入前景广阔[14] 投资机会与标的推荐 **1. 基础设施与算力** * **核心推荐逻辑**:高频交互、大规模API调用及边缘计算加速需求,使得高效的数据传输速度至关重要[3][15] * **网络基础设施**:强烈推荐**网速(NetSpeed)**,因其对提升用户体验至关重要[3][15][16] * **国产算力芯片**:推荐**海光**、**寒武纪**,尽管市场有悲观预期,但Token消耗增长带来的算力需求是**不可避免的物理规律**,长期发展前景良好,是中长期买入机会[3][16][17][20] **2. AI视频制作** * **行业进展**:AI视频制作发展迅速,例如**四人团队10天**可制作高质量**120分钟**AI漫剧,CDS 2.0等新模型助力生成真人剧[18] * **相关标的**:推荐**兆驰股份**和**万兴科技**,后者推出了调用其他模型辅助设计脚本的视频工具[3][18] **3. 数据中心(IDC)** * **布局逻辑**:围绕主要云平台产业链进行布局[3][19] * **推荐标的**: * **字节链**:东阳光、润泽[3][19] * **阿里链**:世纪互联数据港[3][19] * **腾讯链**:科华数据[3][19]
春节AI大战只是表现?摩根大通:token消耗量将进入高速增长期,五年或增长370倍!
华尔街见闻· 2026-02-10 19:23
文章核心观点 - 春节期间各大科技巨头的AI应用推广战是表面现象,更深层的趋势是消费者获取信息和消费内容的方式发生结构性改变,这将推动AI推理Token消耗量开启一个长达多年的高速增长期 [1] - 市场目前判断AI应用端的胜负为时尚早,更具确定性的投资机会在于“二阶赢家”,即AI基础设施的直接受益者以及具有网络广告业务敞口的公司 [1] AI应用推广战:策略与目标 - 腾讯在春节期间投入10亿元人民币开展红包活动,采用“增长优先”策略,利用微信社交轨道降低用户门槛,旨在短时间内扩大“元宝”的安装量和激活量 [2] - 阿里巴巴宣布了30亿元人民币的“春节请客计划”,集成淘宝、支付宝、飞猪和高德地图,其目标不仅是提高“通义千问”的采用率,更是为了培养“从AI界面发起交易”的智能体商业习惯,以缩短消费漏斗,提高转化效率 [2] - 百度投入约5亿元人民币,坚持“AI助手+搜索分发”的综合战略,试图将AI嵌入意图更强的搜索会话中 [3] - 字节跳动虽未公布大规模现金补贴,但其豆包系列模型日活用户已达到1亿,凭借产品迭代和抖音等生态入口的分发能力参与竞争 [3] - 巨头们愿意通过营销“购买时间”的关键原因在于,在流量入口层失去心智份额的代价极高 [3] Token消耗量增长预测与驱动因素 - 摩根大通预测,中国的AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3,900千万亿,五年间增长约370倍 [4] - 2025年至2030年,中国Token消耗量的年复合增长率将高达330%左右 [1] - 增长主要由两个因素驱动:一是AI在消费者和企业工作负载中的渗透率提高;二是应用场景从简单的对话AI扩展到复杂的智能体和多模态输出 [4] - 截至2025年12月,字节跳动豆包系列模型的日均Token消耗量已突破50万亿,同比增长超10倍 [4] Token消耗结构变化 - 对话AI占总消耗量的比例预计将从2025年的近一半下降至2030年的高个位数 [4] - “知识工作者AI智能体”因涉及多步骤推理和文档工作流,预计到2030年将占总消耗量的三分之一 [4] - 多模态AI(图片、音频和视频工作负载)的份额将从目前的15%增长至2030年的接近40% [4] 基础设施与投资机会 - 大型互联网平台的推广投入加速了用户从传统搜索转向聊天机器人,并培养智能体商业习惯,这一进程推升了推理量,从而加快了Token的消耗速度 [1] - 目前的GPU算力需求过剩或供不应求的状况将在未来几年持续 [1] - Token增长并不线性等同于芯片需求增长,因为新一代硬件(如英伟达Blackwell,推理性能4倍于Hopper)和软件堆栈优化,使得每GPU小时处理的Token量也在显著改善 [5] - 更具确定性的投资机会在于“二阶赢家”,包括中国AI基础设施的直接受益者(如阿里巴巴和百度)以及具有网络广告业务敞口的公司(如快手) [1] - 中国AI基建已成为TMT领域最具吸引力的投资主题之一 [1]
做不到“绝对公正”与“全网比价”的AI购物助理,都不会成功
虎嗅APP· 2026-02-07 18:10
AI大模型对电商行业的影响 - 文章核心观点认为,AI大模型的发展将重塑电商行业,但其成功的关键在于能否满足“绝对公正”与“全网比价”的消费者需求,而现有主流电商平台因其依赖广告收入的商业模式,难以实现真正公正的AI购物助理,因此AI更可能颠覆依靠信息差牟利的中间商,而非“物美价廉”定位明确的平台[6][18][26] - AI购物助理的当前价值有限,例如亚马逊的AI助手Rufus在2025年贡献了120亿美元的年交易额,仅占其当年约7000亿美元GMV的1.67%,其作用更类似于高阶客服,是存量互卷而非创造增量[11][12][17] - 成功的AI购物助理需要满足两个核心条件:一是平台有“自我革命的决心”放弃广告利益追求公正,二是能解决明确的用户需求,目前看,不以广告为主要盈利模式的苹果、OpenAI或微信更具潜力,但实现难度极大,因各大平台不会开放商品库[18][27][28] 主要电商平台的商业模式与AI适配性分析 - 亚马逊与淘宝的商业模式与“全网比价”的AI导购存在根本矛盾,两者最赚钱的业务均为广告,亚马逊2025年广告收入达668亿美元,同比增长22%,毛利率可能高达80%,平台优先服务付费广告商而非追求绝对低价,导致其AI助手无法推荐外部更便宜的商品[19][22] - 拼多多的商业模式使其更适应AI时代,其广告收费是商家获得曝光的“入场券”而非暴利来源,前提是商品必须满足“全网最低价”,这种“物美价廉”的定位与消费者追求性价比的本质需求一致,不依赖信息差赚钱[20][26] - 评价零售商业模式先进与否的标准,是看平台是否像Costco一样,将最好的商品以最显眼的方式提供给消费者,而非将责任转嫁给品牌商或收取上架费,从价格本分角度看,排序为拼多多 > 亚马逊 > 淘宝[21][22] AI购物的应用场景与需求分类 - AI导购的应用场景存在明确边界,按消费类型分类,AI更容易解决洗衣液、牙膏等“功能消费”需求,因其参数可量化,但对于买衣服、看直播带货等“情感消费”需求则难以替代[25] - 按消费动机分类,对于京东这类“人找货”的目的性搜索场景,AI助理仅能帮助比价,但无法创造增量购买价值,因为用户本身已明确需求,AI并未起到专业导购作用[25][26] - 对于淘宝、拼多多每日约4亿日活的“货找人”兴趣消费场景(主要用户为女性),AI助理难以替代“逛”的体验和推荐算法刺激的随机性购买需求[25] 科技巨头资本开支与AI算力投入 - 美国AI巨头为应对算力需求,计划在2026年进行史无前例的资本开支:谷歌预计1750-1850亿美元,亚马逊约2000亿美元,微软年化约1500亿美元,Meta在1150-1350亿美元之间,四家合计约6000-6700亿美元,占美国28万亿美元GDP约2.14%[8][9] - 相比之下,阿里巴巴未来三年总资本开支计划为4800亿人民币(约690亿美元),年均约250亿美元,仅为亚马逊2026年计划的1/8[9] - 巨头资本开支激增源于算力“供不应求”,例如谷歌约60%资本开支用于购买GPU/TPU服务器,40%用于数据中心建设[8] AI发展的宏观背景与数据支撑 - 人工智能被定义为堪比工业革命的重要技术革命,其发展规模将远超Web3、物联网等过往概念[7] - 中国日均AI计算Token消耗量从2024年初的1000亿个,增长至2025年9月的40万亿个,在不到两年内增长了400多倍,标志着AI应用正在快速渗透[7]
阿里云(2):Token 爆发在即,看好全栈玩家突围
长江证券· 2026-01-31 22:58
行业投资评级 - 投资评级为“看好”,并维持此评级 [11] 报告核心观点 - 观察海外AI产业发展路径,从大厂密集投入资本开支到Token爆发存在约两年的滞后期,国内大厂投入滞后海外一年,预计国内Token数量将在2026年迎来真正爆发 [3][6][8] - 在Token爆发的背景下,云厂商作为AI应用的“血液”将率先受益 [3][9] - 横向对比,具备全栈式AI布局的企业更容易将模型进步转化为业务收入或壁垒,从而率先形成AI投资回报的正循环,看好这类玩家突围 [3][9] 海外AI产业发展观察 - 海外AI产业从2023年大厂密集投入资本开支,到2025年Token爆发,中间存在约两年滞后期 [6][21] - 2023年为AI投入周期开启阶段,海外大厂开始大幅投入资本开支 [21] - 2024年,资本开支主要用于昂贵的大模型训练,例如GPT-4训练成本预计超过7800万美元,同年大模型进入密集迭代期,头部云厂商如AWS、Azure、GCS的收入增速开始明显抬升 [30][32][36] - 2025年,随着部分场景如编程、多模态等逐步跑通,需求侧核心指标Token数开始高速增长,例如谷歌2025年9月处理的Tokens用量已达1300万亿,日均处理43.33万亿 [38][40] 国内AI产业发展现状与预判 - 国内大厂AI资本开支投入周期较海外滞后约一年,于2024年下半年正式开启 [3][7][45] - 国内头部模型水平基本滞后海外一年到一年半,与投入周期滞后时间一致 [7][46] - 2024年至2025年,国内头部云厂商收入已率先反映AI投入回报,例如阿里云收入同比增速从最低点的3%迅速回升至最新一季度的26% [7][48] - 以字节为代表的国内大厂日均Token消耗量在2025年下半年开始上升,但与海外相比仍有较大差距 [7][54] - 参照海外周期,国内Token数量有望在2026年迎来真正爆发,随着编程和多模态模型产品成熟,下游应用场景有望被真正打开 [3][8][52] 云计算行业的受益逻辑与竞争格局 - AI时代,云与大模型紧密绑定,成为推理范式下的算力核心,将率先受益于Token爆发 [9][56] - AI为云计算带来新的需求,主要是IaaS层和模型即服务层需求,并有望推动商业模式从资源定价转向价值定价,长期提升云基础资源毛利水平 [9] - 模型实力将在很大程度上决定云的竞争力,例如阿里云在AI云市场的占有率(35.8%)高于其在传统IaaS市场的占有率(约26%) [56] - 预计2025年至2030年,中国AI云市场复合年增长率(CAGR)为26.8% [56] 全栈AI玩家的竞争优势 - AI当前变现手段有限,主要依赖广告、编程、订阅、云计算等,非常依赖于企业原有的业务底蕴和用户积累 [9][60] - 大厂之间的竞争胜负手在于:模型能力是否顶尖或在特定赛道有统治力;以及是否拥有全栈式AI布局以形成更有效的商业闭环 [9][60] - 全栈AI玩家更容易将模型的每一次进步转化为业务收入或壁垒,形成商业正循环 [3][9] - 谷歌是形成有效商业闭环的范例,其具备“模型(Gemini)+加速器(TPU)+数据中心网络(OCS)+场景(搜索+广告+Android终端)”的全栈布局,并在股价上体现超额收益 [61][63] - 阿里云已完成从底层算力到模型服务平台再到Agent开发平台的全栈AI布局,其通义千问模型能力获行业认可 [67][72] - 通义千问系列模型表现优异,Qwen3-Max-Thinking总参数规模超1万亿,预训练数据规模达36T Tokens,性能可与国际顶级闭源模型竞争 [72] - 通义千问在开源社区影响力巨大,衍生模型数突破20万个,下载量突破10亿次,居全球开源大模型第一 [76] - 阿里在C端应用入口侧持续发力,千问APP上线23天月活跃用户数突破3000万;灵光APP上线4天下载量突破100万;蚂蚁阿福依托支付入口和医疗资源网络打造健康陪伴应用 [78][80][81]