Workflow
算力换效果
icon
搜索文档
未知机构:国金计算机科技GLM5技术解析国产模型进入算力换效果阶段Token消耗-20260224
未知机构· 2026-02-24 12:25
纪要涉及的公司与行业 * **公司**:智谱AI(GLM模型开发者)[1] * **行业**:人工智能大模型、国产算力芯片生态[1][2] 核心观点与论据 * **模型性能大幅提升**:GLM-5总参数量翻倍至744B,激活参数为40B,相比前代GLM-4.5的355B(激活参数32B)实现大幅扩容[1] 在各项核心基准测试中平均提升约20%,综合实力比肩Claude Opus 4.5与GPT-5.2[1] * **Agentic能力跃升**:模型致力于推动AI从被动的代码生成向自主规划、迭代的“Agentic Engineering”转变[2] 在SWE-bench Verified测试中得分达到77.8%,BrowseComp得分75.9%[1] 在内部真实场景测试集CC-Bench-V2中展现了出色的端到端处理能力[2] * **进入“算力换效果”阶段**:引入“交替思考”模式,在每次回复和调用工具前进行深度推理,这会带来海量的长前缀预填充,从而导致算力需求的指数级提升[2] * **技术优化降低算力成本**:采用DSA稀疏注意力架构,在处理长序列时直接将GPU注意力算力成本降低了一半[1] 通过极致的W4A8量化策略,在单台节点即可媲美国际双GPU集群,并将长序列场景下的部署成本大幅削减50%[2] * **深度适配国产芯片生态**:模型技术优化与国产芯片生态深度适配[2] 其他重要内容 * **国产模型能力达到新阶段**:国产模型能力的下限从“抽卡”到“工业化可用”,达到了Coding、Agent稳定可用的要求[2] * **未来展望**:后续发展将受益于Token放量及出海[2]