中信建投:春节大厂模型频发 云需求有望“通胀”
智通财经网·2026-02-23 20:51

大模型技术密集迭代 - 春节期间海内外头部AI厂商密集发布新一代基座模型,产业趋势正从对话式问答向复杂工程任务全自动托管演进 [1] - 本次技术周期的核心特征包括并行智能体架构、复杂逻辑推理、超长上下文以及原生视音频模态 [1] 海外厂商技术进展 - 谷歌:发布Gemini 3.1 Pro,在ARC-AGI-2测试中以77.1%的准确率领先,原生支持百万Token超长上下文,MRCR v2测试准确率达84.9%,LiveCodeBench Pro积分达2887领跑行业 [2] - Anthropic:发布Claude Sonnet 4.6,在OSWorld评测中计算机操作能力跃升至72.5%,在维持每百万输入3美元定价基础上优化了多步任务连贯性 [3] - xAI:发布5000亿参数Grok 4.2测试版,采用多智能体集群机制,在Alpha Arena大模型实时投资比赛中成为唯一实现正向收益的模型 [3] 国内厂商技术进展 - 阿里巴巴:开源Qwen 3.5旗舰系列,将解码吞吐量提升8.6倍,百炼平台已上线Qwen 3.5-Plus旗舰接口 [4] - 字节跳动:发布豆包2.0矩阵,其Pro版本在数学及编程竞赛评测中达到金牌水平,并将Token成本降低约一个数量级 [4] - 智谱AI:推出7440亿参数旗舰基座模型GLM-5,在华为昇腾算力集群上实现W4A8混合精度量化,在长序列与低时延场景下的部署成本降低50% [5] - MiniMax:M2.5模型的SWE-Bench Verified准确率达80.2%,在100 TPS推理速度下,每秒输出100 Token连续运行一小时仅需1美元,已在内部接管约30%的真实业务场景 [5][6] - 月之暗面(Kimi):发布Kimi K2.5,采用智能体集群与并行智能体强化学习框架,使端到端推理延迟降低4.5倍 [6] 云服务行业趋势 - AI推理需求带来的“刚性溢价”拉动行业进入向上拐点,国内外云厂商涨价函频发 [7] - 阿里云增速自24Q2以来持续上涨,25Q3增速创下近三年34%的季度新高,其AI相关产品收入连续九个季度实现三位数同比增长 [7] - 云资源定价模式从“以价换量”全面转向“溢价变现” [7] 云涨价逻辑下的核心方向 - 边缘云/CDN:AI推理将大规模向边缘侧下沉,建议关注CDN涨价带来利润弹性及边缘AI推理市场 [7] - 云回迁:中心云成本增加,企业选择在本地部署超融合或分布式存储以降低成本 [7] - 头部云厂商价值重估:持续看好拥有AI云服务定价权的头部云服务提供商 [7] 底层硬件价值分布变化 - 底层硬件价值分布从“重算力”全面转向“算存并重” [1][8] - CPU:AI Agent向边缘及端侧下沉,其自主规划、工具调用及复杂逻辑推理高度依赖CPU,伴随Agent普及,非流式处理及串行计算需求激增,驱动CPU用量及规格提升 [8] - 内存互连与存算协同:高并发推理导致“内存墙”瓶颈凸显,数据中心加速部署CXL等高速互连技术以实现内存池化,降低CPU等待时间及算力总拥有成本 [8]