智谱AI发布并开源GLM-5大模型 - 智谱AI于2月11日上线并开源了GLM-5大模型 [1] - 该模型在Coding与Agent能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务 [2] - 模型参数规模从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,大幅提升通用智能水平 [2] - 模型构建了全新的"Slime"异步强化学习框架,支持更大模型规模及更复杂强化学习任务 [2] - 模型首次集成DeepSeek Sparse Attention稀疏注意力机制,在维持长文本效果无损的同时,大幅降低模型部署成本、提升Token Efficiency [2] 国产芯片平台完成深度适配与优化 - 智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化 [2] - 模型能够在国产算力集群上实现高吞吐、低延迟的稳定运行 [2] - 海光DCU团队通过深度协同与自研软件栈优势,重点优化底层算子与硬件加速,使GLM-5在海光DCU上实现高吞吐、低延迟的稳定运行 [1] - 摩尔线程基于SGLang推理框架,在其旗舰级AI训推一体全功能GPU MTT S5000上,Day-0完成了全流程适配与验证 [1] - 摩尔线程打通了模型推理全链路,并深度释放MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用 [1] 国产AI芯片技术参数与性能披露 - 摩尔线程首次公布了MTT S5000的算力参数,该卡基于第四代MUSA架构"平湖"打造 [1] - MTT S5000单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算 [1] 智谱AI近期技术探索与发布 - 一个月前,智谱图像生成模型GLM-Image发布 [2] - GLM-Image模型采用"自回归+扩散解码器"混合架构,是智谱面向"认知型生成"技术范式的一次重要探索,也是首个开源工业表现级离散自回归图像生成模型 [2] 华为昇腾对模型训练的支持 - 华为计算方面表示,昇腾NPU和昇思MindSpore AI框架提供从数据到训练的全流程支撑,并提出一系列训练性能优化特性 [3] - 华为的技术助力智谱高性能训练出首个基于自主创新算力底座全程训练的SOTA模型 [3]
多款国产芯片宣布Day0支持智谱GLM-5