事件概述 - 智谱公司联合华为开源了最新图像生成模型GLM-Image,这是首个在国产芯片(昇腾Atlas 800T A2)上完成全流程训练的SOTA多模态模型 [1] - 该模型的发布验证了在国产全栈算力底座上训练前沿模型的可行性,标志着高端算力不再必须依赖进口 [1] - 受此消息影响,智谱公司股价当日大涨18%报收216港元,上市一周来股价较116.2港元发行价接近翻倍,市值一度突破千亿港元 [5] 模型性能与行业地位 - GLM-Image在复杂视觉文字生成(CVTG-2K)榜单中,Word Accuracy达到0.9116,NED指标达到0.9557,均位列开源模型第一 [7][8] - 在长文本渲染(LongText-Bench)榜单中,GLM-Image英文任务得分0.952,中文任务得分0.979,双语成绩均位列开源模型第一 [9] - 模型在多项指标上超越了Qwen-Image、Z-Image等开源模型,部分指标甚至超越了国际顶尖竞品Nano Banana Pro [6][7] 技术架构与创新 - 模型采用「自回归+扩散解码器」混合架构,其中9B自回归部分负责语义理解,7B扩散解码器部分采用DiT结构解决文字渲染问题 [13] - 模型基于华为昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练 [1] - 通过自研训练套件,对数据预处理、预训练、SFT及RL等关键环节进行端到端优化,并利用动态图多级流水、高性能融合算子及多流并行等技术提升效率 [10][12] - 创新的Tokenizer策略支持无需后期裁剪即可生成1024-2048范围内任意长宽尺寸的图片 [13] 成本与商业化 - 在API调用模式下,使用GLM-Image生成一张图片仅需0.1元,成本极具竞争力 [15] - 极低的生成成本证明了国产算力在经济性上已具备与国际顶尖水平竞争的能力 [15] 行业影响与国产替代意义 - 模型的成功发布正值美国解禁英伟达H200对华出口之际,但事件表明高端算力已从“卡脖子”的生存命门转变为“货比三家”的成本选项 [16] - 这证明了即使完全脱离美系算力生态,中国头部大模型依然能够对标甚至超越国际顶尖竞品 [16] - 对于被列入美国实体清单的智谱公司而言,此次与华为的合作意味着国产大模型企业拥有了国产算力托底和全球供应链改善的双重保障 [16] - 此次合作标志着国产全栈技术从“可用”迈向了“好用”且“敢用”的新阶段,中国AI产业正进入以自主创新定义技术范式的新时期 [16][17]
英伟达H200“解禁”次日,智谱联手华为发布全国产开源多模态模型!