智谱发布新一代旗舰模型GLM-5，重点提升编程与智能体能力

文章核心观点 - 智谱公司于2月11日正式发布新一代旗舰大模型GLM-5，主攻编程与智能体能力，官方称其在开源领域达到最优表现，标志着国产大模型技术能力持续追赶国际领先水平 [1] - GLM-5的发布是国产AI大模型在春节档期密集竞逐的最新案例，反映出行业竞争正进入白热化阶段 [5][6] 模型架构与规模升级 - 模型总参数规模由上一代GLM-4.7的355B大幅扩展至744B，激活参数从32B提升至40B [1][2] - 预训练数据量从23T提升至28.5T，更大规模的算力投入驱动通用智能能力显著增强 [2] - 模型架构构建78层隐藏层，集成256个专家模块，每次激活8个，激活参数约44B，稀疏度5.9%，上下文窗口最高支持202K token [2] - 首次引入DeepSeek稀疏注意力机制，在保持长文本处理效果无损的前提下，旨在降低部署成本并提升Token利用效率，技术路线与DeepSeek-V3/V3.2保持一致 [2] 核心能力表现 - 编程能力：在内部Claude Code评估集中，GLM-5在前端、后端及长程任务等编程开发场景下，平均性能较上一代GLM-4.7提升超20% [1][3] - 编程体验：官方称真实编程环境中的使用体感已逼近Claude Opus 4.5水平，能够以极少人工干预自主完成Agentic长程规划与执行、后端重构、深度调试等复杂系统工程任务 [1][3] - 智能体能力：在多项评测基准中达成开源SOTA（最优表现），在BrowseComp（联网检索与信息理解）、MCP-Atlas（大规模端到端工具调用）及τ2-Bench（复杂场景下自动代理工具规划与执行）三项测试中均位列开源第一 [4] 训练技术与框架创新 - 为实现能力突破，公司构建了全新的“Slime”训练框架，支持更大规模模型架构与更复杂的强化学习任务，显著提升强化学习后训练流程效率 [4] - 提出异步智能体强化学习算法，使模型具备从长程交互中持续学习的能力，有效激发预训练模型的深层潜力，该机制已成为GLM-5的核心技术特色之一 [4] 行业竞争态势 - 智谱GLM-5的发布是国产AI大模型春节档密集竞逐的最新注脚，同日晚间，Minimax亦上线Minimax 2.5，距离上一版本2.2发布仅间隔一个多月 [5] - 此轮发布潮已持续升温，DeepSeek此前已推出新模型，阿里千问的Qwen 3.5、字节跳动的SeeDance 2.0等产品也于近期相继亮相 [6] - 多家厂商不约而同选择在春节窗口期集中推新，折射出国产大模型赛道竞争正进入白热化阶段 [6] 发布与验证状态 - 智谱方面证实，此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为GLM-5 [1] - GLM-5模型已上线chat.z.ai平台 [1] - 目前GLM-5与Minimax 2.5的详细技术文档尚未完全披露，其实际性能表现仍有待开发者社区与专业机构的后续验证 [6]