Workflow
Sonnet4.6
icon
搜索文档
GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货
量子位· 2026-03-28 13:17
文章核心观点 - 智谱公司最新发布的GLM-5.1模型在编程能力上相比上一代GLM-5有显著提升,评测得分飙升近10分,且与全球领先的Claude Opus 4.6模型差距仅为2.6分 [1][2] - 该模型已面向所有GLM Coding Plan用户开放(包括Lite/Pro/Max),开放后需求火爆,一度售罄 [9][10] - 尽管官方文档和公告信息有限,但根据现有资料和网友实测,GLM-5.1在代码生成、空间结构理解、动态环境构建等方面展现出强大能力 [12] 模型性能与评测 - **编程能力大幅提升**:在Coding Evaluation评测中,GLM-5.1相比上一代GLM-5得分直接飙升近10分 [1] - **接近全球顶尖水平**:其编程能力评测得分与当前全球最强的编程模型Claude Opus 4.6相比,仅有2.6分之差 [2] - **潜在超越同级对手**:有网友推测,其评分可能已经超过了目前仅次于Opus 4.6的Sonnet4.6模型 [4] 模型能力与实测表现 - **核心能力定位**:模型定位主要偏向代码场景,并支持reasoning模式 [16] - **空间结构理解**:在生成室内设计平面图的实测中,模型对厨房、客厅、卧室等区域划分明确,并能处理动线关系,显示出对空间结构的到位理解能力 [18][19][20] - **动态环境构建**:在生成可交互的“我的世界”游戏实测中,模型展现了“动态补全能力”,即随着镜头移动,能对未出现区域的内容进行持续生成,保持画面流畅不卡顿 [25][26][29] - **空间一致性**:在游戏搭建实测中,模型能一起生成场景、视角和交互,说明其在处理连续环境时能呈现相对稳定的空间状态 [28] - **复杂任务处理**:有用户将关于灵巧手的研究资料输入模型后,成功生成了一本专业的行业手册,输出效果远超用户预期 [7][9] 模型配置与发布信息 - **模型配置**:支持在Claude Code中手动切换使用,也能接入OpenClaw进行自定义配置,同时支持OpenAI Compatible接入,降低了开发者的使用门槛 [14][17] - **上下文窗口**:大约在200K级别,基本延续了GLM-5的配置,量级上没有太大变化 [16] - **迭代节奏**:GLM-5.1距离上一代GLM-5模型的发布仅间隔一个多月,表明公司产品处于非常快速的迭代周期中 [31] - **版本定位**:GLM-5.1更像是上一代模型的强化版本,其提升更多体现在稳定性、执行效率以及复杂任务下的表现上 [32] 用户反响与市场热度 - **开放范围广泛**:模型率先向GLM Coding Plan的全部用户(包括Lite用户)开放 [9][17] - **市场需求旺盛**:模型开放后因过于火爆而直接显示“售罄” [10] - **开发者积极实测**:众多网友在模型发布后立即进行实测,并将其应用于日常工作流,例如生成专业手册、构建交互式游戏等 [4][6][7]
OpenClaw 2026.2.17版本发布
新浪财经· 2026-02-18 11:54
公司产品更新 - 公司发布了OpenClaw 2026.2.17版本 [1] - 此次更新内容包括Sonnet 4.6模型 [1] - 更新支持1M上下文长度的测试 [1] - 新增从聊天中生成子代理的功能 [1] - 新增iOS分享扩展功能 [1]