文章核心观点 - 2026年春节期间,中国互联网大厂及AI公司密集发布多模态大模型新品,推动行业竞争格局重塑,并导致AI推理的Token需求出现结构性“通胀”,进而引发产业链(如云服务、模型服务)开启涨价周期,标志着行业定价逻辑从传统流量指标转向以Token消耗为核心 [4][6][10][11] AI行业春节新品密集发布 - 2026年马年春节,互联网大厂在红包营销后,迎来国产AI新品的密集发布“春节档” [4] - 字节跳动在2月14日发布豆包大模型2.0系列,此前已发布Seedance 2.0视频模型和Seedream 5.0 Lite图像模型 [4] - 智谱于2月11日发布GLM-5模型,MiniMax于2月12日上线并开源文本模型M2.5,DeepSeek进行了版本更新,阶跃星辰发布Step 3.5 Flash,阿里发布Qwen3-Coder-Next并有望发布Qwen 3.5 [4] - 此轮发布覆盖文本、图像、视频多模态,旨在卡位并尝试重塑行业格局 [4] Token需求出现结构性“通胀” - 多模态大模型(尤其是视频模型)的算力消耗规模快速膨胀,例如字节Seedance 2.0生成一条10秒、1080p视频大致消耗35万token [6] - 行业数据显示Token消耗量呈指数级增长:火山引擎大模型日均Token调用量从2024年底的2万亿增长至2025年底的63万亿 [7] - 阿里云外部客户2025年日均Token调用接近5万亿,2026年目标至少15-20万亿,其内部业务日均调用计划从16-17万亿提升至100万亿 [7] - 中国整体日均Token消耗从2024年初的1000亿,增长至2025年中突破30万亿,到2026年2月主流大模型合计日均消耗已达180万亿级别 [7] - 摩根大通预测,中国的AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿,五年增长约370倍 [9] - 这种“通胀”指单位时间内、单位用户的Token消耗结构性上升,而非Token本身变贵 [6] 主要厂商Token调用量对比 - 根据数据,截至2026年2月,主要厂商/模型的日均Token调用量(万亿)为:豆包(火山引擎)63、通义千问(阿里)32、元宝(腾讯)28、DeepSeek系列22、智谱清言15、金山系8、小米MIMO 2、其他(如文心等)合计10 [8] - 豆包(火山引擎)的调用量为中国第一、全球第三,其视频模型Seedance是关键消耗场景之一 [8] - 通义千问受阿里生态、电商广告和活动拉动明显,元宝依托微信生态与广告场景快速放量,DeepSeek由开源与企业服务驱动,智谱清言为ToB与ToC双轮驱动 [8] 产业链开启涨价周期 - 2026年以来,全球云计算市场进入密集涨价周期,亚马逊云、谷歌云相继提价,国内厂商优刻得迅速跟进 [10] - 智谱打响年内大模型涨价“第一枪”,于2月12日宣布对GLM Coding Plan套餐进行结构性调整,整体价格涨幅30%起,并取消首购优惠,该套餐上线即售罄 [10] - 涨价背景是用户规模与调用量快速提升导致算力阶段性紧张,此前智谱已对Coding Plan采取“限量发售”,形成了“需求短期大增→资源刚性约束→涨价”的典型供需链条 [10] 行业定价逻辑与商业模式转变 - 智谱的涨价信号意味着大模型时代的“计量单位”从传统流量(如DAU/使用时长)转向Token(推理消耗) [11] - Token消耗在许多应用场景中成为刚需,其需求“通胀”不仅利好云端算力提供商,也让模型厂商获得了议价权 [11] - 产业定价逻辑发生改变,当推理消耗变成生产资料,模型厂商有机会通过分层定价与订阅化产品,将“算力稀缺”转化为毛利与现金流 [11] 券商建议的投资方向 - 第一,关注云厂商与算力基础设施:AI拉动的IT支出与基础设施投入仍处上行周期,云端将受益于GPU算力、存储与网络I/O等“伴随型消耗”的持续增长 [12] - 第二,关注大模型厂商:若其能在编程、Agent、企业流程等高投资回报率场景中维持订阅留存与企业席位扩张,将Token用量稳定转化为“省人省时省返工”的交付价值,则具备穿越开源与价格战的能力 [12] - 第三,关注安全治理与运行时的防护工具:随着企业将AI嵌入工作流,数据泄露、代理越权等风险将推动“AI安全平台/治理平台”成为刚需 [13]
AI“最强春节档”来了
财联社·2026-02-16 15:41