文章核心观点 - 智谱公司于2月11日正式发布新一代旗舰大模型GLM-5,主攻编程与智能体能力,官方称其在开源领域达到最优表现,标志着国产大模型技术能力持续追赶国际领先水平 [1] - GLM-5的发布是国产AI大模型在春节档期密集竞逐的最新案例,反映出行业竞争正进入白热化阶段 [5][6] 模型架构与规模升级 - 模型总参数规模由上一代GLM-4.7的355B大幅扩展至744B,激活参数从32B提升至40B [1][2] - 预训练数据量从23T提升至28.5T,更大规模的算力投入驱动通用智能能力显著增强 [2] - 模型架构构建78层隐藏层,集成256个专家模块,每次激活8个,激活参数约44B,稀疏度5.9%,上下文窗口最高支持202K token [2] - 首次引入DeepSeek稀疏注意力机制,在保持长文本处理效果无损的前提下,旨在降低部署成本并提升Token利用效率,技术路线与DeepSeek-V3/V3.2保持一致 [2] 核心能力表现 - 编程能力:在内部Claude Code评估集中,GLM-5在前端、后端及长程任务等编程开发场景下,平均性能较上一代GLM-4.7提升超20% [1][3] - 编程体验:官方称真实编程环境中的使用体感已逼近Claude Opus 4.5水平,能够以极少人工干预自主完成Agentic长程规划与执行、后端重构、深度调试等复杂系统工程任务 [1][3] - 智能体能力:在多项评测基准中达成开源SOTA(最优表现),在BrowseComp(联网检索与信息理解)、MCP-Atlas(大规模端到端工具调用)及τ2-Bench(复杂场景下自动代理工具规划与执行)三项测试中均位列开源第一 [4] 训练技术与框架创新 - 为实现能力突破,公司构建了全新的“Slime”训练框架,支持更大规模模型架构与更复杂的强化学习任务,显著提升强化学习后训练流程效率 [4] - 提出异步智能体强化学习算法,使模型具备从长程交互中持续学习的能力,有效激发预训练模型的深层潜力,该机制已成为GLM-5的核心技术特色之一 [4] 行业竞争态势 - 智谱GLM-5的发布是国产AI大模型春节档密集竞逐的最新注脚,同日晚间,Minimax亦上线Minimax 2.5,距离上一版本2.2发布仅间隔一个多月 [5] - 此轮发布潮已持续升温,DeepSeek此前已推出新模型,阿里千问的Qwen 3.5、字节跳动的SeeDance 2.0等产品也于近期相继亮相 [6] - 多家厂商不约而同选择在春节窗口期集中推新,折射出国产大模型赛道竞争正进入白热化阶段 [6] 发布与验证状态 - 智谱方面证实,此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为GLM-5 [1] - GLM-5模型已上线chat.z.ai平台 [1] - 目前GLM-5与Minimax 2.5的详细技术文档尚未完全披露,其实际性能表现仍有待开发者社区与专业机构的后续验证 [6]
智谱发布新一代旗舰模型GLM-5,重点提升编程与智能体能力