异构算力协同
搜索文档
中信建投:春节大厂模型频发 云需求有望“通胀”
智通财经网· 2026-02-23 20:51
大模型技术密集迭代 - 春节期间海内外头部AI厂商密集发布新一代基座模型,产业趋势正从对话式问答向复杂工程任务全自动托管演进 [1] - 本次技术周期的核心特征包括并行智能体架构、复杂逻辑推理、超长上下文以及原生视音频模态 [1] 海外厂商技术进展 - **谷歌**:发布Gemini 3.1 Pro,在ARC-AGI-2测试中以77.1%的准确率领先,原生支持百万Token超长上下文,MRCR v2测试准确率达84.9%,LiveCodeBench Pro积分达2887领跑行业 [2] - **Anthropic**:发布Claude Sonnet 4.6,在OSWorld评测中计算机操作能力跃升至72.5%,在维持每百万输入3美元定价基础上优化了多步任务连贯性 [3] - **xAI**:发布5000亿参数Grok 4.2测试版,采用多智能体集群机制,在Alpha Arena大模型实时投资比赛中成为唯一实现正向收益的模型 [3] 国内厂商技术进展 - **阿里巴巴**:开源Qwen 3.5旗舰系列,将解码吞吐量提升8.6倍,百炼平台已上线Qwen 3.5-Plus旗舰接口 [4] - **字节跳动**:发布豆包2.0矩阵,其Pro版本在数学及编程竞赛评测中达到金牌水平,并将Token成本降低约一个数量级 [4] - **智谱AI**:推出7440亿参数旗舰基座模型GLM-5,在华为昇腾算力集群上实现W4A8混合精度量化,在长序列与低时延场景下的部署成本降低50% [5] - **MiniMax**:M2.5模型的SWE-Bench Verified准确率达80.2%,在100 TPS推理速度下,每秒输出100 Token连续运行一小时仅需1美元,已在内部接管约30%的真实业务场景 [5][6] - **月之暗面(Kimi)**:发布Kimi K2.5,采用智能体集群与并行智能体强化学习框架,使端到端推理延迟降低4.5倍 [6] 云服务行业趋势 - AI推理需求带来的“刚性溢价”拉动行业进入向上拐点,国内外云厂商涨价函频发 [7] - 阿里云增速自24Q2以来持续上涨,25Q3增速创下近三年34%的季度新高,其AI相关产品收入连续九个季度实现三位数同比增长 [7] - 云资源定价模式从“以价换量”全面转向“溢价变现” [7] 云涨价逻辑下的核心方向 - **边缘云/CDN**:AI推理将大规模向边缘侧下沉,建议关注CDN涨价带来利润弹性及边缘AI推理市场 [7] - **云回迁**:中心云成本增加,企业选择在本地部署超融合或分布式存储以降低成本 [7] - **头部云厂商价值重估**:持续看好拥有AI云服务定价权的头部云服务提供商 [7] 底层硬件价值分布变化 - 底层硬件价值分布从“重算力”全面转向“算存并重” [1][8] - **CPU**:AI Agent向边缘及端侧下沉,其自主规划、工具调用及复杂逻辑推理高度依赖CPU,伴随Agent普及,非流式处理及串行计算需求激增,驱动CPU用量及规格提升 [8] - **内存互连与存算协同**:高并发推理导致“内存墙”瓶颈凸显,数据中心加速部署CXL等高速互连技术以实现内存池化,降低CPU等待时间及算力总拥有成本 [8]
中国电信完成业界首个面向大模型推理的异构算力协同技术验证
新浪财经· 2025-10-14 07:42
试验核心成果 - 业界首次完成DeepSeek系列模型基于英伟达算力与国产算力交叉组合的异构PD分离推理试验验证 [1] - 试验实现大模型推理集群降本增效,在6类典型场景下完成推理性能验证 [1] - DeepSeek 671B模型在多种场景下实现推理集群总吞吐性能提升30%至72% [1] - 模型并发能力提升2倍,同等吞吐条件下异构算力组合推理成本最高下降42% [1] - 试验达成存量利旧与国产替代的双重目标 [1] 技术实现路径 - 行业共识为针对推理Prefill与Decode阶段特性优化芯片设计,英伟达与华为已发布相应芯片规划 [2] - 公司构建异构通信优化、PD资源调配、推理任务调度全栈自研异构混推体系 [2] - 通过自研异构传输引擎实现跨架构芯片PD池间KVCache的高效传输 [2] - 采用自研国产算力赋能工具“翼芯”,根据业务特征与算力性能自动推荐并实时优化PD资源配比 [2] - 构建AI推理平台,实现推理任务在Prefill池与Decode池间的动态调度 [2] 行业影响与未来规划 - 技术验证成功体现公司对智算推理优化技术的深刻理解及对国产算力适配调优的实践创新 [2] - 彰显公司作为算力基础设施建设方推动国产算力从可用到好用的央企担当 [2] - 未来将持续深化国产算力高质量发展布局,面向大模型训推一体、多智能体系统打造互联互通高效协同的异构算力生态格局 [2]