“北京造”大模型GLM-4.5开源,综合性能世界领先
新京报·2025-07-30 23:59

模型性能与定位 - 公司发布新一代旗舰大模型GLM-4.5,专为智能体应用打造,在复杂推理、代码生成及智能体交互等通用能力上实现融合与突破,综合测试性能跻身全球领先行列 [1] - 该模型代表了AI向通用人工智能的重要转变,旨在成为能理解复杂目标、自主规划并执行多步骤任务的“全优生”,而非仅是被动回答问题的聊天机器人 [1] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一 [1] - 该模型是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求 [5] - 模型拥有更高的参数效率,其参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现更出色 [6] - 在衡量模型代码能力的SWE-bench Verified榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,表明在相同规模下实现了最佳性能 [6] 技术应用与演示 - 模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页 [1] - 实际演示中,用户通过简单指令,即可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏 [1] 市场定价与成本 - 目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格 [3] - 外媒报道普遍聚焦该模型“成本更低、性能更优”的特性 [3] 行业影响与市场反应 - 模型发布仅十小时便引发全球外媒关注,发布后不到两个小时,X平台就在首页推荐了这款中国大模型 [4] - 发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二 [4] - 外媒评价认为,中国企业研发的AI模型智能化水平提升且使用成本持续降低,中国正逐步成为全球AI竞争的核心参与者 [4][5] - 有媒体指出,GLM-4.5为企业团队提供了一个可行的、高性能的基础模型,对于平衡创新和运营限制的团队来说是一个令人信服的选择 [4] - 公司作为中国“AI六小虎”之一,自今年6月被OpenAI“点名”后便备受关注,此次发布开源模型被视作试图在蓬勃发展的行业中抢占制高点 [4] 模型获取与开源 - 集高性能、低成本和开源特性于一体的模型已在公司开放平台上线,用户可通过该平台使用 [8] - 其开源版本也将同步登陆Hugging Face与ModelScope平台 [8]

“北京造”大模型GLM-4.5开源,综合性能世界领先 - Reportify