GLM-5模型的技术突破与全球地位 - 智谱AI新一代旗舰大模型GLM-5正式上线,其内测匿名版本“Pony Alpha”此前在海外OpenRouter平台登顶热度榜首,代理式编程单项实测超越Claude Opus位列全球第一 [1] - 在权威评测Artificial Analysis Intelligence Index v4.0中,GLM-5以50分综合成绩并列全球第三,仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5,成为全球排名最靠前的国产模型之一 [1] - GLM-5是国内首个跟上硅谷Agentic Coding前沿趋势的模型,实现从“对话式代码生成”到“端到端系统工程”的突破,在构建高并发电商系统等复杂任务中展现顶尖工程能力 [3] - 在专业评测中,GLM-5取得SWE-bench Verified 77.8分(逼近Opus 4.6的80.9分)、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠,其Coding与Agent能力达到开源SOTA [4] - 模型采用MoE稀疏架构,擅长长程Agent任务与复杂系统设计,可支撑数百次工具调用、长程记忆与复杂指令执行 [4] - 一手实测显示,GLM-5在工业级后端开发、长步骤复杂任务规划等工程化核心场景中,其“聪明程度”已经逼近Claude Opus 4.5 [7][14] - 在代理编程场景得分589,超越Claude Opus 4.5的585分位列全球第一,而完成同等编程任务的推理成本仅0.14美元,不足Opus 4.6(6.39美元)的1/40 [14] GLM-5的工程化能力与生产力价值 - GLM-5在《TerraLive》全栈开发实测中,展现出能独立负责从需求分析到产品落地的资深全栈工程师+3D图形工程师+交互设计师的能力,交付功能完整、体验流畅、视觉精美的3D地球产品 [8][10] - 从一句提示词到可交互应用耗时极短,效率提升是传统开发模式的数倍,被评价为真正意义上的“超级生产力引擎” [10][13] - 智能写作方面,GLM-5可自动拆解复杂分析任务、输出专业垂直报告,并高效提炼信息 [11] - 该模型标志着国产大模型首次在真实工程场景中拥有比肩国际顶尖水平的“系统架构师”,行业竞争重心从通用能力比拼转向垂直场景深度落地与工程化能力 [4] GLM-5的国产算力生态适配 - GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等七家主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行 [5] - 华为昇腾实现Day0全流程适配,在推理侧基于Atlas 800 A3采用W4A8混合精度量化实现744B模型单机高效部署;训练侧在128K长序列下显存减少30G、性能较FA提升8倍 [5] - 摩尔线程在旗舰级AI训推一体GPU MTT S5000上Day-0完成全流程适配与验证;GLM-5在海光DCU平台上已实现高吞吐、低延迟的稳定推理与训练性能 [5] - 此举验证了国产芯片集群对大规模生成式模型的承载能力,成为生态成熟的前夜 [6] 市场反响与资本市场影响 - 匿名模型“Pony Alpha”在海外引爆技术圈,在官方确认其为GLM-5前,已直接驱动相关公司股价连续两日大幅上涨,成为港股AI板块最强催化 [1][16] - 受消息发酵影响,公司股价连续两日强势领涨,公司总市值一度站上1500亿港元,跻身港股科技股前列 [16] - 这是国产大模型首次出现海外技术热度倒逼港股估值的案例,市场交易逻辑已从“跟随者”切换至关注MoE架构、开源SOTA等硬核突破 [17] - 资金押注其技术兑现,验证了市场对国产大模型头部厂商技术迭代与商业化前景的高度认可,意味着资本市场对AI公司的定价权正从财报转向技术预期 [16][17]
智谱GLM-5实测逼近Claude Opus 4.5,国产大模型实力再获突破!
财联社·2026-02-12 11:34