智谱发布国内最强Coding模型「GLM-4.6」,寒武纪、摩尔线程完成对其适配

文章核心观点 - 智谱于9月30日正式发布并开源新一代大模型GLM-4.6,在代码能力等核心性能上实现显著提升 [2] - GLM-4.6的代码生成能力已全面对齐Claude Sonnet 4,成为国内最强Coding模型,整体性能超越DeepSeek-V3.2-Exp [5] - 该模型与寒武纪、摩尔线程等国产AI芯片成功适配,标志着国产大模型与国产芯片协同进入新阶段,加速构建自主可控的AI技术生态 [7] 技术发布与性能表现 - GLM-4.6是继DeepSeek-V3.2-Exp与Claude Sonnet 4.5之后,国庆节前夕业界的又一重大技术发布 [2] - 模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级 [5] - 作为开源模型,GLM-4.6是目前全球开源生态中性能最强的通用大模型之一,提升了国产大模型在全球竞争格局中的地位 [5] 国产芯片适配与协同 - GLM-4.6已在寒武纪领先的国产AI芯片上实现FP8+Int4混合量化推理部署,这是首次在国产芯片上投产的FP8+Int4模型-芯片一体化解决方案 [7] - 该方案在保持模型精度不变的前提下,大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径 [7] - 摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,其新一代GPU可在原生FP8精度下稳定运行模型,验证了MUSA架构及全功能GPU在生态兼容性和快速适配能力方面的优势 [7] 产业应用与未来展望 - 寒武纪与摩尔线程完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力 [7] - GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务,释放更广泛的社会与产业价值 [7] - 未来,国产原创的GLM系列大模型与国产芯片的深度协同,将在模型训练和推理环节持续推动性能与效率的双重优化,构建更加开放、可控、高效的人工智能基础设施 [7]