真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强
量子位·2025-09-30 16:26
模型性能提升 - 代码能力在74个真实场景编程任务测试中超过Claude Sonnet 4,成为国内最强[5] - 在AIME 25、GPQA等八大通用能力评测榜单中大部分对齐Claude Sonnet 4,位列国内第一[6] - 平均token消耗比GLM-4.5节省30%以上,为同类模型最低[8] - 上下文窗口由128K扩展至200K,适应更长的代码和智能体任务[28] 实测能力展示 - 代码生成速度快,不到一分钟即可生成一个射击类小游戏[14] - 能够创建多彩的可交互动画,并实现鼠标点击交互效果[16][18][19] - 能处理涉及重力、摩擦力和逼真反弹的经典物理编程题目[20][22] - 数学能力方面,能正确解答AIME 2025试题,并展示了识图的多模态能力[24][25] 国产芯片适配与部署 - 在寒武纪国产芯片上实现FP8+Int4混合量化部署,是国产芯片首次真正落地的FP8+Int4模型芯片一体化方案[27] - 在摩尔线程新一代GPU上,借助vLLM推理框架,能用原生FP8精度稳定运行GLM-4.6[30] - 模型与国产芯片的组合通过智谱MaaS平台正式对企业和大众开放服务[32] 成本与市场策略 - 推出GLM Coding Plan,最低20元包月套餐,以Claude 1/7的价格提供其9/10的智商水平[34]