“北京造”大模型GLM-4.5开源，综合性能世界领先

模型性能与定位 - 公司发布新一代旗舰大模型GLM-4.5，专为智能体应用打造，在复杂推理、代码生成及智能体交互等通用能力上实现融合与突破，综合测试性能跻身全球领先行列 [1] - 该模型代表了AI向通用人工智能的重要转变，旨在成为能理解复杂目标、自主规划并执行多步骤任务的“全优生”，而非仅是被动回答问题的聊天机器人 [1] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中，其综合得分位列全球第三，在所有国产模型和开源模型中均排名第一 [1] - 该模型是首款原生融合模型，首次在单个模型中实现将推理、编码和智能体能力原生融合，以满足智能体应用的复杂需求 [5] - 模型拥有更高的参数效率，其参数量仅为一些主流模型的一半甚至三分之一，但在多项标准基准测试中表现更出色 [6] - 在衡量模型代码能力的SWE-bench Verified榜单上，GLM-4.5系列位于性能/参数比帕累托前沿，表明在相同规模下实现了最佳性能 [6] 技术应用与演示 - 模型能够胜任全栈开发任务，一键生成较为复杂的应用、游戏、交互网页 [1] - 实际演示中，用户通过简单指令，即可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”，甚至直接上线一个完整的“Flappy Bird”小游戏 [1] 市场定价与成本 - 目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens，远低于市场主流价格 [3] - 外媒报道普遍聚焦该模型“成本更低、性能更优”的特性 [3] 行业影响与市场反应 - 模型发布仅十小时便引发全球外媒关注，发布后不到两个小时，X平台就在首页推荐了这款中国大模型 [4] - 发布后不到12小时，GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二 [4] - 外媒评价认为，中国企业研发的AI模型智能化水平提升且使用成本持续降低，中国正逐步成为全球AI竞争的核心参与者 [4][5] - 有媒体指出，GLM-4.5为企业团队提供了一个可行的、高性能的基础模型，对于平衡创新和运营限制的团队来说是一个令人信服的选择 [4] - 公司作为中国“AI六小虎”之一，自今年6月被OpenAI“点名”后便备受关注，此次发布开源模型被视作试图在蓬勃发展的行业中抢占制高点 [4] 模型获取与开源 - 集高性能、低成本和开源特性于一体的模型已在公司开放平台上线，用户可通过该平台使用 [8] - 其开源版本也将同步登陆Hugging Face与ModelScope平台 [8]