综合性能领先 智谱GLM-4.5登顶HuggingFace Trending榜单
证券日报网·2025-07-30 20:50
模型性能与效率 - GLM-4-5参数量为DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多项标准基准测试中表现更好,得益于更高的参数效率[3] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一[3] - API调用价格低至输入价格为0.8元/百万tokens,输出价格2元/百万tokens,大幅低于目前主流模型定价[3] 模型能力与发展目标 - 大语言模型的目标是在广泛领域达到人类认知水平,而非针对特定任务设计专家模型,需具备通用问题解决、泛化能力、常识推理和自我改进等核心能力[4] - GLM-4-5致力于在一个模型中统一集成通用问题解决、编程、数学、推理等各种不同能力,以克服现有模型仅在特定任务上表现最佳的局限[4] 产品发布与可用性 - GLM-4-5模型系列已上线超算互联网AI社区,包括基础模型、混合推理模型以及混合推理模型的FP8版本[4] - 企业和开发者均可在AI社区快速下载模型文件进行部署和微调开发[4]