“全球大模型第一股” 公开技术细节
上海证券报·2026-02-23 13:39

公司技术发布与突破 - 智谱于2月22日发布技术报告,全面解读其新一代大模型GLM-5的技术细节 [1] - GLM-5旨在实现从“氛围编程”到“智能体工程”的范式转变,目标是让AI成为能自主规划、执行和迭代的“虚拟工程师” [4] - 模型在技术上实现了四大突破:更高效的模型“大脑”、更快的“学习”方式、更聪明的“决策”算法以及全面拥抱国产算力生态 [4][6] 核心技术细节 - 引入DSA稀疏注意力机制,使模型能智能聚焦关键信息,降低计算成本,以更少资源处理更长上下文 [5] - 模型参数规模扩展至744B(7440亿),训练token规模提升至28.5T(28.5万亿) [6] - 构建名为“slime”的异步强化学习基础设施,将“生成任务轨迹”与“模型参数更新”解耦并行,极大提升训练效率 [6] - 提出全新的异步Agent RL算法,深度优化模型在动态环境下的规划、执行与自我纠错能力 [6] - 全面兼容华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦与燧原七大主流国产芯片平台,完成从底层到上层的深度优化 [6] 市场反响与行业意义 - 发布后以代号“Pony Alpha”在OpenRouter平台匿名盲测,引发社区轰动,25%用户推测其为Claude Sonnet5,20%认为是Grok新版本,10%猜是DeepSeek-V4 [7] - 盲测结果有力回击了外界对中国本土模型技术水准的质疑 [7] - 硅谷风投机构a16z数据显示,开源大模型与顶级闭源模型能力差距正快速收窄,GLM-5被选为开源阵营代表与闭源天花板ClaudeOpus4.6正面对标 [7] - 公司表示将坚定不移探索技术前沿,构建更高效智能的底层系统,继续推进开源追赶闭源的战役 [8]