认知型生成
搜索文档
港股异动丨智谱高开超7%,联合华为开源首个国产芯片训练的多模态SOTA模型
格隆汇· 2026-01-15 01:31
公司股价与市场反应 - 公司股票高开7.1%,报194.7港元 [1] 核心产品与技术发布 - 公司联合华为开源新一代图像生成模型GLM-Image [1] - 该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程 [1] - 该模型是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] 技术架构与创新 - GLM-Image采用自主创新的“自回归+扩散解码器”混合架构 [1] - 该架构实现了图像生成与语言模型的联合 [1] - 此次发布是公司面向以Nano Banana Pro为代表的新一代“认知型生成”技术范式的一次重要探索 [1]
英伟达H200“解禁”次日,智谱联手华为发布全国产开源多模态模型!
观察者网· 2026-01-14 17:34
事件概述 - 智谱公司联合华为开源了最新图像生成模型GLM-Image,这是首个在国产芯片(昇腾Atlas 800T A2)上完成全流程训练的SOTA多模态模型 [1] - 该模型的发布验证了在国产全栈算力底座上训练前沿模型的可行性,标志着高端算力不再必须依赖进口 [1] - 受此消息影响,智谱公司股价当日大涨18%报收216港元,上市一周来股价较116.2港元发行价接近翻倍,市值一度突破千亿港元 [5] 模型性能与行业地位 - GLM-Image在复杂视觉文字生成(CVTG-2K)榜单中,Word Accuracy达到0.9116,NED指标达到0.9557,均位列开源模型第一 [7][8] - 在长文本渲染(LongText-Bench)榜单中,GLM-Image英文任务得分0.952,中文任务得分0.979,双语成绩均位列开源模型第一 [9] - 模型在多项指标上超越了Qwen-Image、Z-Image等开源模型,部分指标甚至超越了国际顶尖竞品Nano Banana Pro [6][7] 技术架构与创新 - 模型采用「自回归+扩散解码器」混合架构,其中9B自回归部分负责语义理解,7B扩散解码器部分采用DiT结构解决文字渲染问题 [13] - 模型基于华为昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练 [1] - 通过自研训练套件,对数据预处理、预训练、SFT及RL等关键环节进行端到端优化,并利用动态图多级流水、高性能融合算子及多流并行等技术提升效率 [10][12] - 创新的Tokenizer策略支持无需后期裁剪即可生成1024-2048范围内任意长宽尺寸的图片 [13] 成本与商业化 - 在API调用模式下,使用GLM-Image生成一张图片仅需0.1元,成本极具竞争力 [15] - 极低的生成成本证明了国产算力在经济性上已具备与国际顶尖水平竞争的能力 [15] 行业影响与国产替代意义 - 模型的成功发布正值美国解禁英伟达H200对华出口之际,但事件表明高端算力已从“卡脖子”的生存命门转变为“货比三家”的成本选项 [16] - 这证明了即使完全脱离美系算力生态,中国头部大模型依然能够对标甚至超越国际顶尖竞品 [16] - 对于被列入美国实体清单的智谱公司而言,此次与华为的合作意味着国产大模型企业拥有了国产算力托底和全球供应链改善的双重保障 [16] - 此次合作标志着国产全栈技术从“可用”迈向了“好用”且“敢用”的新阶段,中国AI产业正进入以自主创新定义技术范式的新时期 [16][17]
智谱高开超7%,联合华为开源首个国产芯片训练的多模态SOTA模型
格隆汇· 2026-01-14 10:24
公司股价与市场反应 - 智谱(2513.HK)股价于1月14日高开7.1%,报194.7港元 [1] 核心产品与技术发布 - 公司联合华为开源新一代图像生成模型GLM-Image [1] - 该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程 [1] - GLM-Image是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] - 模型采用自主创新的“自回归+扩散解码器”混合架构,实现了图像生成与语言模型的联合 [1] - 此次发布是公司面向以Nano Banana Pro为代表的新一代“认知型生成”技术范式的一次重要探索 [1]
联合华为开源新模型,智谱涨超16%
新浪财经· 2026-01-14 10:21
公司事件与市场反应 - 智谱联合华为于1月14日开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型 [1][9] - 消息公布当天,智谱港股开盘股价大涨超16% [1][10] 技术定位与行业趋势 - 行业技术范式正从单一的图像生成,进化为兼具世界知识与推理能力的“认知型生成”,以谷歌Gemini生态下的Nano Banana Pro为代表的闭源模型正在推动图像生成与大语言模型的深度融合 [2][11] - GLM-Image是公司面向“认知型生成”技术范式的一次重要探索,也是首个开源的工业表现级离散自回归图像生成模型 [2][12] 模型架构与技术细节 - GLM-Image采用“自回归+扩散解码器”混合架构,创新地融合了9B的自回归模型与7B的DiT扩散解码器,以同时提升对复杂指令的语义理解、全局构图能力,以及图像高频细节和文字笔画的还原精度,改善“提笔忘字”现象 [2][12] - 通过改进Tokenizer策略,模型能够自适应处理多种分辨率,原生支持从1024x1024到2048×2048尺寸的任意比例图像生成,无需重新训练 [3][12] 模型性能表现 - 基于架构创新,GLM-Image在文字渲染的权威榜单中达到开源SOTA水平 [6][13] - 具体性能数据:在CVTG-2K榜单的Word Accuracy指标上得分为0.9116,MED指标得分为0.9557,CLIPScore得分为0.7877;在LongText-Bench榜单的AMG、EN、ZH指标上分别得分为0.966、0.952、0.979 [13] 应用场景与商业化 - 在应用演示中,GLM-Image更擅长绘制包含复杂逻辑流程与文字说明的科普插画及原理示意图 [5][15] - 在生成电商图、漫画等多格图画时,能够保持风格和主体的一致性,并保障多处文字生成的准确率 [8][17] - 在API调用模式下,使用GLM-Image生成一张图片仅需0.1元 [8][17] 国产化生态意义 - GLM-Image是对国产计算生态的一次深度探索与验证,其自回归结构基座从数据预处理到大规模预训练的全流程均在昇腾Atlas 800T A2设备上完成 [8][17] - 公司依托昇腾NPU和昇思MindSpore AI框架,自研了模型训练套件,全面优化了端到端流程,验证了在国产全栈算力底座上训练高性能多模态生成模型的可行性 [8][17]
联合华为开源新模型 智谱涨超16%
上海证券报· 2026-01-14 10:18
公司动态与产品发布 - 智谱于1月14日联合华为开源新一代图像生成模型GLM-Image [2] - GLM-Image是首个在国产芯片(昇腾Atlas 800T A2设备)上完成从数据到训练全流程的SOTA多模态模型 [2][9] - 该模型基于昇思MindSpore AI框架开发,是首个开源的工业表现级离散自回归图像生成模型 [2][5] - 在API调用模式下,使用GLM-Image生成一张图片的价格为0.1元 [8] 技术架构与创新 - GLM-Image采用“自回归+扩散解码器”混合架构,融合了9B的自回归模型与7B的DiT扩散解码器 [5] - 自回归模型专注于提升对指令的语义理解和画面全局构图,DiT扩散解码器配合Glyph Encoder专注于还原图像高频细节和文字笔画 [5] - 通过改进Tokenizer策略,模型能自适应处理多种分辨率,原生支持从1024x1024到2048×2048尺寸的任意比例图像生成,无需重新训练 [5] - 公司自研了模型训练套件,利用动态图多级流水下发、高性能融合算子、多流并行等特性,全面优化了数据预处理、预训练、SFT和RL的端到端流程 [8] 性能表现与市场定位 - GLM-Image在文字渲染的权威榜单中达到开源SOTA水平 [6] - 在CVTG-2K基准测试中,GLM-Image的文字准确率(Word Accuracy)为0.9116,归一化编辑距离(NED)为0.9557,CLIP得分为0.7877 [6] - 在LongText-Bench测试中,其平均得分(AVG)为0.966,英文(EN)得分0.952,中文(ZH)得分0.979 [6] - Demo显示,模型擅长绘制包含复杂逻辑流程与文字说明的科普插画、原理示意图,以及在生成电商图、漫画等多格图画时能保持风格和主体一致性并保障文字生成准确率 [7] 行业趋势与战略意义 - 以Nano Banana Pro为代表的闭源图像生成模型,正在推动图像生成与大语言模型的深度融合,技术范式正从单一的图像生成进化为兼具世界知识与推理能力的“认知型生成” [5] - GLM-Image是公司面向“认知型生成”技术范式的一次重要探索 [5] - 该模型是对国产计算生态的一次深度探索与验证,证明了在国产全栈算力底座上训练高性能多模态生成模型的可行性 [8][9] 市场反应 - 新闻发布当天港股开盘,智谱股价大涨超16% [4]
智谱联合华为开源图像生成模型GLM-Image:首个在国产芯片完成全程训练的SOTA模型
IPO早知道· 2026-01-14 09:57
模型发布与核心意义 - 智谱于1月14日联合华为开源新一代图像生成模型GLM-Image [3] - 该模型是首个在国产芯片(昇腾Atlas 800T A2设备)上完成全程训练的SOTA模型,验证了在国产全栈算力底座上训练前沿模型的可行性 [4][10] - GLM-Image是智谱面向“认知型生成”技术范式的一次重要探索,也是首个开源的工业表现级离散自回归图像生成模型 [5] 技术架构与创新 - GLM-Image采用了创新的“自回归 + 扩散解码器”混合架构,融合了9B的自回归模型与7B的DiT扩散解码器,以兼顾全局指令理解与局部细节刻画 [4][7] - 通过改进Tokenizer策略,模型能自适应处理多种分辨率,原生支持从1024x1024到2048×2048尺寸的任意比例图像生成 [7] - 该架构旨在克服海报、PPT、科普图等知识密集型场景的生成难题,并改善模型“提笔忘字”的现象 [4][7] 性能表现与基准测试 - 在文字渲染的权威榜单CVTG-2K中,GLM-Image以0.9116的Word Accuracy(文字准确率)和0.9557的NED(归一化编辑距离)成绩,位列开源模型第一 [6][8] - 在LongText-Bench长文本渲染榜单中,GLM-Image以英文0.952、中文0.979的成绩位列开源模型第一 [6][8] - 在API调用模式下,生成图片仅需0.1元,速度优化版本即将更新 [5] 国产算力生态实践 - 模型从数据预处理到大规模预训练的全流程均在昇腾Atlas 800T A2设备与昇思MindSpore AI框架上完成 [4][10] - 通过动态图多级流水下发、高性能融合算子、多流并行等自研训练套件,全面优化了端到端训练流程 [10] - 这一实践是首个在国产芯片上完成全流程训练的SOTA多模态模型,为社区挖掘国产算力潜力提供了参考 [10]
智谱联合华为开源图像生成模型 GLM-Image
21世纪经济报道· 2026-01-14 09:23
公司动态 - 智谱与华为于1月13日联合开源新一代图像生成模型GLM-Image,该模型在科普插画、多格图画、社交媒体图文、商业海报、写实摄影等方面均可落地 [2] - GLM-Image是首个在国产芯片(昇腾Atlas 800T A2设备)上完成全程训练的SOTA多模态模型,验证了在国产全栈算力底座上训练前沿模型的可行性 [2] - 公司依托昇腾NPU和昇思MindSpore AI框架,自研了模型训练套件,全面优化了数据预处理、预训练、SFT和后训练的端到端流程 [2] - 通过动态图多级流水优化机制消除下发瓶颈,通过多流并行策略打破通信墙,并使用AdamW EMA、COC、RMS Norm等昇腾亲和的高性能融合算子,同步提升训练的稳定性和性能 [2] - GLM-Image采用自主创新的“自回归+扩散解码器”混合架构,实现了图像生成与语言模型的联合 [3] - 在API调用模式下,生成一张图片仅需0.1元,速度优化版本即将更新 [3] 技术进展 - 以Nano Banana Pro为代表的闭源图像生成模型正在推动图像生成与大语言模型的深度融合,技术范式正从单一的图像生成进化为兼具世界知识与推理能力的认知型生成 [3] - 当前模型在海报、PPT、科普图等知识密集型场景及高保真细节呈现上表现较好 [3] - GLM-Image的“自回归”架构利用其语言模型的底座优势,专注于提升对指令的语义理解和画面的全局构图 [3] - 其“扩散解码器”配合Glyph Encoder的文本编码器,专注于还原图像的高频细节和文字笔画,以此改善模型“提笔忘字”的现象 [3]
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
格隆汇· 2026-01-14 08:31
公司技术发布 - 智谱联合华为开源新一代图像生成模型GLM-Image [1] - 该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程 [1] - GLM-Image是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] 模型技术架构 - GLM-Image采用自主创新的「自回归+扩散解码器」混合架构 [1] - 该架构实现了图像生成与语言模型的联合 [1] - 此次发布是智谱面向以Nano Banana Pro为代表的新一代「认知型生成」技术范式的重要探索 [1]