软件工程2.0
搜索文档
体验完智谱刚刚发布的 GLM-5,我终于明白它为什么让硅谷猜破了头
36氪· 2026-02-12 11:43
GLM-5模型发布与核心特性 - 智谱AI正式发布其新一代大模型GLM-5,此前该模型在互联网上以代号“Pony Alpha”引发广泛猜测 [1] - 该模型采用MoE架构,总参数量达744B,激活参数为40B,使其在保持强大能力的同时更为轻量 [15] - 模型集成了DeepSeek Sparse Attention(稀疏注意力机制),显著提升了处理长上下文(如数十万行代码)的能力并降低了部署成本 [15] - 官方基准测试显示,GLM-5在SWE-bench-Verified和Terminal Bench 2.0两个高难度编程榜单中分别取得77.8分和56.2分,其编程能力在真实场景中已无限逼近Claude Opus 4.5 [12] 技术突破与创新训练方法 - GLM-5的核心突破在于其采用了全新的“Slime”训练框架,该框架采用异步强化学习,使模型训练从传统的“考试”模式转变为“实习”模式,通过完成完整的长程项目并在交互反馈中学习 [15] - 模型展现出强大的“智能体工程”能力,能够理解复杂需求背后的物理规律与逻辑,而不仅仅是执行指令,例如成功生成模拟卫星信号传输(包含多普勒效应视觉隐喻)及交通流动态模拟的代码 [4][6][8] - 在代码生成过程中,模型表现出类似人类的规划与设计思维,会主动确认技术栈、核心玩法等需求细节,并以系统架构师的方式推进项目 [9] 开源战略与生态影响 - GLM-5以开源形式发布,成为首个在“智能体工程”领域提供开源基础设施的国产模型 [4] - 该模型已与Claude Code、OpenCode等主流开发工具打通,预示着软件工程可能进入2.0时代 [17] - 模型的成功运行标志着国产AI生态已形成完整闭环,官方致谢名单涵盖了华为昇腾、摩尔线程、寒武纪、昆仑芯等中国半导体行业的主要厂商,表明其已在国产芯片集群上实现高吞吐、低延迟的稳定运行 [15][17] 应用演示与性能表现 - 在具体应用测试中,GLM-5能够根据复杂提示词生成功能完整的应用,例如:生成一个编译后仅15MB的全功能媒体播放器(支持MP4/MP3解码、播放列表管理及深色模式UI) [8];创建一个可交互的、应用图标能实际打开的Mac系统模拟界面 [11];以及构建一个包含经济系统、动作元素、背包UI和NPC对话功能的火柴人开放世界游戏 [13] - 模型在代码生成任务中能接受需求的实时调整与增补,展现出高度的灵活性与协作性 [9][13] - 社区用户给予高度评价,有观点认为其表现要么接近AGI,要么已完全掌握了复杂的SVG题目库 [6]