“全球大模型第一股” 公开技术细节

公司技术发布与突破 - 智谱于2月22日发布技术报告，全面解读其新一代大模型GLM-5的技术细节 [1] - GLM-5旨在实现从“氛围编程”到“智能体工程”的范式转变，目标是让AI成为能自主规划、执行和迭代的“虚拟工程师” [4] - 模型在技术上实现了四大突破：更高效的模型“大脑”、更快的“学习”方式、更聪明的“决策”算法以及全面拥抱国产算力生态 [4][6] 核心技术细节 - 引入DSA稀疏注意力机制，使模型能智能聚焦关键信息，降低计算成本，以更少资源处理更长上下文 [5] - 模型参数规模扩展至744B（7440亿），训练token规模提升至28.5T（28.5万亿） [6] - 构建名为“slime”的异步强化学习基础设施，将“生成任务轨迹”与“模型参数更新”解耦并行，极大提升训练效率 [6] - 提出全新的异步Agent RL算法，深度优化模型在动态环境下的规划、执行与自我纠错能力 [6] - 全面兼容华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦与燧原七大主流国产芯片平台，完成从底层到上层的深度优化 [6] 市场反响与行业意义 - 发布后以代号“Pony Alpha”在OpenRouter平台匿名盲测，引发社区轰动，25%用户推测其为Claude Sonnet5，20%认为是Grok新版本，10%猜是DeepSeek-V4 [7] - 盲测结果有力回击了外界对中国本土模型技术水准的质疑 [7] - 硅谷风投机构a16z数据显示，开源大模型与顶级闭源模型能力差距正快速收窄，GLM-5被选为开源阵营代表与闭源天花板ClaudeOpus4.6正面对标 [7] - 公司表示将坚定不移探索技术前沿，构建更高效智能的底层系统，继续推进开源追赶闭源的战役 [8]