文章核心观点 - 智谱公司最新发布的GLM-5.1模型在编程能力上相比上一代GLM-5有显著提升,评测得分飙升近10分,且与全球领先的Claude Opus 4.6模型差距仅为2.6分 [1][2] - 该模型已面向所有GLM Coding Plan用户开放(包括Lite/Pro/Max),开放后需求火爆,一度售罄 [9][10] - 尽管官方文档和公告信息有限,但根据现有资料和网友实测,GLM-5.1在代码生成、空间结构理解、动态环境构建等方面展现出强大能力 [12] 模型性能与评测 - 编程能力大幅提升:在Coding Evaluation评测中,GLM-5.1相比上一代GLM-5得分直接飙升近10分 [1] - 接近全球顶尖水平:其编程能力评测得分与当前全球最强的编程模型Claude Opus 4.6相比,仅有2.6分之差 [2] - 潜在超越同级对手:有网友推测,其评分可能已经超过了目前仅次于Opus 4.6的Sonnet4.6模型 [4] 模型能力与实测表现 - 核心能力定位:模型定位主要偏向代码场景,并支持reasoning模式 [16] - 空间结构理解:在生成室内设计平面图的实测中,模型对厨房、客厅、卧室等区域划分明确,并能处理动线关系,显示出对空间结构的到位理解能力 [18][19][20] - 动态环境构建:在生成可交互的“我的世界”游戏实测中,模型展现了“动态补全能力”,即随着镜头移动,能对未出现区域的内容进行持续生成,保持画面流畅不卡顿 [25][26][29] - 空间一致性:在游戏搭建实测中,模型能一起生成场景、视角和交互,说明其在处理连续环境时能呈现相对稳定的空间状态 [28] - 复杂任务处理:有用户将关于灵巧手的研究资料输入模型后,成功生成了一本专业的行业手册,输出效果远超用户预期 [7][9] 模型配置与发布信息 - 模型配置:支持在Claude Code中手动切换使用,也能接入OpenClaw进行自定义配置,同时支持OpenAI Compatible接入,降低了开发者的使用门槛 [14][17] - 上下文窗口:大约在200K级别,基本延续了GLM-5的配置,量级上没有太大变化 [16] - 迭代节奏:GLM-5.1距离上一代GLM-5模型的发布仅间隔一个多月,表明公司产品处于非常快速的迭代周期中 [31] - 版本定位:GLM-5.1更像是上一代模型的强化版本,其提升更多体现在稳定性、执行效率以及复杂任务下的表现上 [32] 用户反响与市场热度 - 开放范围广泛:模型率先向GLM Coding Plan的全部用户(包括Lite用户)开放 [9][17] - 市场需求旺盛:模型开放后因过于火爆而直接显示“售罄” [10] - 开发者积极实测:众多网友在模型发布后立即进行实测,并将其应用于日常工作流,例如生成专业手册、构建交互式游戏等 [4][6][7]
GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货
量子位·2026-03-28 13:17