Workflow
参数效率
icon
搜索文档
赛道Hyper | 智谱GLM-4.5:技术突破成因与行业价值
华尔街见闻· 2025-08-01 08:41
作者:周源/华尔街见闻 7月28日,智谱AI发布旗舰模型GLM-4.5并开源。GLM-4.5是一款专为智能体应用研发的基础模型,在 性能、成本控制与多能力融合等方面均有出色表现。 在这些技术突破的背后,哪些因素起了支撑作用? 智谱AI核心团队主要来自清华大学KEG(知识工程)实验室:董事长刘德兵、CEO张鹏和总裁王绍兰 均为KEG实验室核心成员,张鹏和王绍兰同为清华创新领军工程博士,首席科学家唐杰曾任清华大学 计算机系教授。 从GLM-1到GLM-4.5经历四年多迭代。 早期(2021年)GLM模型(10B)就已探索了Transformer架构的优化,2022年推出参数规模达130B的 GLM-130B,2023年推出的GLM-3尝试了混合专家(MoE)架构的轻量化设计,为后续参数效率提升奠 定基础,其小步快跑的迭代模式,让团队对模型架构的理解不断深化。 GLM系列的LLM(大语言模型:Large Language Model)基于Transformer架构构建。 GLM-130B采用DeepNorm(一种用于稳定深层Transformer模型训练的归一化方法)作为层归一化 (Layer Normalizat ...