智谱正式发布并开源新一代大模型GLM-4.6 寒武纪、摩尔线程完成对智谱GLM-4.6的适配

大模型技术发布 - 智谱公司于9月30日正式发布并开源新一代大模型GLM-4-6 [1] - 新模型在Agentic Coding等核心能力上实现大幅跃升 [1] - 此次发布是继DeepSeek-V3-2-Exp与Claude Sonnet4-5之后业界的又一重大技术发布 [1] 模型性能表现 - GLM-4-6的代码生成能力在公开基准测试和真实编程任务中已全面对齐Claude Sonnet4 [1] - 该模型成为目前国内最强的Coding模型 [1] - 模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级 [1] - 整体性能超越DeepSeek-V3-2-Exp [1] - GLM-4-6是目前全球开源生态中性能最强的通用大模型之一 [1] 国产芯片适配与部署 - GLM-4-6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署 [1] - 这是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案 [1] - 该方案在保持模型精度不变的前提下大幅降低了推理成本 [1] - 摩尔线程基于vLLM推理框架完成了对GLM-4-6的适配 [2] - 新一代GPU可在原生FP8精度下稳定运行模型 [2] 产业生态协同 - 寒武纪与摩尔线程完成对GLM-4-6的适配标志着国产GPU已具备与前沿大模型协同迭代的能力 [2] - 此举加速构建自主可控的AI技术生态 [2] - GLM-4-6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务 [2] - 国产原创GLM系列大模型与国产芯片的深度协同将在模型训练和推理环节持续推动性能与效率的双重优化 [2]