昇思MindSpore AI框架
搜索文档
多款国产芯片宣布Day0支持智谱GLM-5
观察者网· 2026-02-12 09:59
智谱AI发布并开源GLM-5大模型 - 智谱AI于2月11日上线并开源了GLM-5大模型 [1] - 该模型在Coding与Agent能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务 [2] - 模型参数规模从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,大幅提升通用智能水平 [2] - 模型构建了全新的"Slime"异步强化学习框架,支持更大模型规模及更复杂强化学习任务 [2] - 模型首次集成DeepSeek Sparse Attention稀疏注意力机制,在维持长文本效果无损的同时,大幅降低模型部署成本、提升Token Efficiency [2] 国产芯片平台完成深度适配与优化 - 智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化 [2] - 模型能够在国产算力集群上实现高吞吐、低延迟的稳定运行 [2] - 海光DCU团队通过深度协同与自研软件栈优势,重点优化底层算子与硬件加速,使GLM-5在海光DCU上实现高吞吐、低延迟的稳定运行 [1] - 摩尔线程基于SGLang推理框架,在其旗舰级AI训推一体全功能GPU MTT S5000上,Day-0完成了全流程适配与验证 [1] - 摩尔线程打通了模型推理全链路,并深度释放MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用 [1] 国产AI芯片技术参数与性能披露 - 摩尔线程首次公布了MTT S5000的算力参数,该卡基于第四代MUSA架构"平湖"打造 [1] - MTT S5000单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算 [1] 智谱AI近期技术探索与发布 - 一个月前,智谱图像生成模型GLM-Image发布 [2] - GLM-Image模型采用"自回归+扩散解码器"混合架构,是智谱面向"认知型生成"技术范式的一次重要探索,也是首个开源工业表现级离散自回归图像生成模型 [2] 华为昇腾对模型训练的支持 - 华为计算方面表示,昇腾NPU和昇思MindSpore AI框架提供从数据到训练的全流程支撑,并提出一系列训练性能优化特性 [3] - 华为的技术助力智谱高性能训练出首个基于自主创新算力底座全程训练的SOTA模型 [3]
智谱联合华为开源图像生成模型GLM-Image,24小时登顶Hugging Face榜单
新浪财经· 2026-01-16 08:45
模型发布与技术合作 - 智谱与华为联合开源新一代图像生成模型GLM-Image [1][2] - 该模型基于华为昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程 [1][2] 模型性能与市场反响 - 模型开源不到24小时即冲上全球知名AI开源社区Hugging Face榜单的全球第一 [1][2] - 在Hugging Face平台上,该模型在文本到图像类别中更新约4小时前,已获得至少2.44k的关注度 [3] 技术创新与架构 - GLM-Image采用了创新的“自回归+扩散解码器”混合架构,不同于开源常用的LDM方案 [1][2] - 该架构兼顾全局指令理解与局部细节刻画,克服了海报、PPT、科普图等知识密集型场景生成难题 [1][2] - 模型尤其擅长汉字生成任务,向探索以Nano Banana Pro为代表的“知识+推理”的认知型生成模型迈出了重要一步 [1][2] 训练验证与国产化可行性 - 实际训练性能足以达到相应计算设备的汇报性能上限 [1][2] - 验证了在国产全栈算力底座(昇腾硬件+昇思框架)上训练前沿模型的可行性 [1][2]
科创创业人工智能ETF鹏华(588410)日均成交超1亿,AI近期迎来密集催化
新浪财经· 2026-01-15 14:31
人工智能行业近期动态与催化 - 近期人工智能领域迎来密集催化,DeepSeek发布引入“条件记忆”等创新机制的最新研究成果,显著提升大语言模型在知识检索与计算效率方面的表现 [1] - 阿里“千问”APP上线两月MAU已破1亿,并宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务 [1] - 智谱联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练,是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] AI商业化与算力需求展望 - 湘财证券指出,AI应用商业化进程加速是算力需求持续走强的核心驱动力 [1] - 核心逻辑在于:海外巨头如OpenAI的商业化推进与国内大模型能力的快速进化,共同拉动训练与推理侧算力需求保持高景气 [1] - 国产算力产能瓶颈有望在2026年实现突破,先进制程制造、架构升级与液冷、光模块等关键环节将迎来明确的增长机遇 [1] 人工智能指数及ETF市场表现 - 截至2026年1月15日14:08,中证科创创业人工智能指数(932456)成分股涨跌互现,合合信息领涨3.45%,中际旭创上涨2.95%,北京君正上涨2.58%,易华录领跌 [2] - 科创创业人工智能ETF鹏华(588410)最新报价1.13元,盘中换手8.72%,成交3809.40万元 [2] - 截至1月14日,科创创业人工智能ETF鹏华近1年日均成交1.15亿元 [2] 人工智能指数构成与权重 - 科创创业人工智能ETF鹏华紧密跟踪中证科创创业人工智能指数,该指数从科创板和创业板中选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本 [2] - 截至2025年12月31日,中证科创创业人工智能指数前十大权重股分别为中际旭创、新易盛、澜起科技、寒武纪、金山办公、芯原股份、润泽科技、协创数据、昆仑万维、北京君正 [2] - 前十大权重股合计占比58.76% [2]
智谱逆市涨超6% 日前宣布联合华为开源新一代图像生成模型
智通财经· 2026-01-15 11:09
公司股价与市场表现 - 智谱公司股价逆市上涨,截至发稿时涨幅达6.39%,报229.8港元,成交额为3.35亿港元 [1] 核心产品与技术进展 - 公司联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas800T A2设备和昇思MindSpore AI框架完成全流程训练 [1] - GLM-Image是首个在国产芯片上完成全程训练的SOTA多模态模型,实现了图像生成与语言模型的联合 [1] - 在API调用模式下,模型生成一张图片的成本仅需0.1元 [1] 机构观点与公司优势 - 东吴证券认为,作为纯大模型公司,其受益于云端规模效应和Agent/编程场景红利 [1] - 机构看好公司在本土大模型技术实力、开源生态布局以及政企本地化落地能力方面的优势 [1] - 公司有望受益于中国大模型行业从本地化部署向云端服务转型的长期趋势 [1]
港股异动 | 智谱(02513)逆市涨超6% 日前宣布联合华为开源新一代图像生成模型
智通财经网· 2026-01-15 11:05
公司股价与市场表现 - 智谱股价逆市上涨6.39%,报229.8港元,成交额达3.35亿港元 [1] 公司技术与产品进展 - 智谱联合华为开源新一代图像生成模型GLM-Image [1] - 该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练,是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] - GLM-Image实现了图像生成与语言模型的联合,在API调用模式下,生成一张图片成本仅需0.1元 [1] 机构观点与行业趋势 - 东吴证券认为,作为纯大模型玩家,公司受益于云端规模效应和Agent/编程场景红利 [1] - 机构看好公司在本土大模型技术实力、开源生态布局以及政企本地化落地能力方面的优势 [1] - 公司有望受益于中国大模型行业从本地化部署向云端服务转型的长期趋势 [1]
智谱联合华为开源新模型,AI人工智能ETF(512930)连续3天净流入
新浪财经· 2026-01-15 10:22
市场表现与资金流向 - 截至2026年1月15日,中证人工智能主题指数成分股涨跌互现,其中深信服领涨6.25%,三六零上涨5.37%,科大讯飞上涨4.37%,而中科星图领跌13.27%,润泽科技下跌6.06%,用友网络下跌5.73% [1] - AI人工智能ETF最新报价为2.39元,近3天获得连续资金净流入,合计净流入6.74亿元,日均净流入达2.25亿元,最高单日净流入3.18亿元 [1] 行业动态与技术进步 - 智谱公司联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练,是在中国国产芯片上完成全程训练的SOTA多模态模型 [1] - 该模型采用自主创新的「自回归+扩散解码器」混合架构,实现了图像生成与语言模型的联合 [1] 行业观点与前景 - 有观点认为当前AI产业催化不断,AI应用商业化具备广阔发展空间,以生成式搜索为代表的AI应用方向正在不断探索和发展 [2] - 除内容生成外,内容交互正成为重要突破点,AI在降本增效之外,为游戏等内容板块用户提供了独特的交互体验,显著提升了用户的参与感 [2] 指数与产品构成 - AI人工智能ETF紧密跟踪中证人工智能主题指数,该指数选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本 [2] - 截至2025年12月31日,中证人工智能主题指数前十大权重股合计占比58.08%,包括中际旭创、新易盛、寒武纪、澜起科技、中科曙光、科大讯飞、海康威视、豪威集团、金山办公、浪潮信息 [2] - AI人工智能ETF设有场外联接基金,包括平安中证人工智能主题ETF发起式联接A、C、E份额 [2]
港股异动丨智谱高开超7%,联合华为开源首个国产芯片训练的多模态SOTA模型
格隆汇· 2026-01-15 01:31
公司股价与市场反应 - 公司股票高开7.1%,报194.7港元 [1] 核心产品与技术发布 - 公司联合华为开源新一代图像生成模型GLM-Image [1] - 该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程 [1] - 该模型是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] 技术架构与创新 - GLM-Image采用自主创新的“自回归+扩散解码器”混合架构 [1] - 该架构实现了图像生成与语言模型的联合 [1] - 此次发布是公司面向以Nano Banana Pro为代表的新一代“认知型生成”技术范式的一次重要探索 [1]
英伟达H200“解禁”次日,智谱联手华为发布全国产开源多模态模型!
观察者网· 2026-01-14 17:34
事件概述 - 智谱公司联合华为开源了最新图像生成模型GLM-Image,这是首个在国产芯片(昇腾Atlas 800T A2)上完成全流程训练的SOTA多模态模型 [1] - 该模型的发布验证了在国产全栈算力底座上训练前沿模型的可行性,标志着高端算力不再必须依赖进口 [1] - 受此消息影响,智谱公司股价当日大涨18%报收216港元,上市一周来股价较116.2港元发行价接近翻倍,市值一度突破千亿港元 [5] 模型性能与行业地位 - GLM-Image在复杂视觉文字生成(CVTG-2K)榜单中,Word Accuracy达到0.9116,NED指标达到0.9557,均位列开源模型第一 [7][8] - 在长文本渲染(LongText-Bench)榜单中,GLM-Image英文任务得分0.952,中文任务得分0.979,双语成绩均位列开源模型第一 [9] - 模型在多项指标上超越了Qwen-Image、Z-Image等开源模型,部分指标甚至超越了国际顶尖竞品Nano Banana Pro [6][7] 技术架构与创新 - 模型采用「自回归+扩散解码器」混合架构,其中9B自回归部分负责语义理解,7B扩散解码器部分采用DiT结构解决文字渲染问题 [13] - 模型基于华为昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练 [1] - 通过自研训练套件,对数据预处理、预训练、SFT及RL等关键环节进行端到端优化,并利用动态图多级流水、高性能融合算子及多流并行等技术提升效率 [10][12] - 创新的Tokenizer策略支持无需后期裁剪即可生成1024-2048范围内任意长宽尺寸的图片 [13] 成本与商业化 - 在API调用模式下,使用GLM-Image生成一张图片仅需0.1元,成本极具竞争力 [15] - 极低的生成成本证明了国产算力在经济性上已具备与国际顶尖水平竞争的能力 [15] 行业影响与国产替代意义 - 模型的成功发布正值美国解禁英伟达H200对华出口之际,但事件表明高端算力已从“卡脖子”的生存命门转变为“货比三家”的成本选项 [16] - 这证明了即使完全脱离美系算力生态,中国头部大模型依然能够对标甚至超越国际顶尖竞品 [16] - 对于被列入美国实体清单的智谱公司而言,此次与华为的合作意味着国产大模型企业拥有了国产算力托底和全球供应链改善的双重保障 [16] - 此次合作标志着国产全栈技术从“可用”迈向了“好用”且“敢用”的新阶段,中国AI产业正进入以自主创新定义技术范式的新时期 [16][17]
利好催化不断,创业板人工智能ETF南方(159382)大涨3.65%,国产大模型加速赋能千行百业,AI产业发展动力强劲
新浪财经· 2026-01-14 11:57
市场表现与交易情况 - 截至2026年1月14日午间收盘,创业板人工智能ETF南方(159382)上涨3.65%,换手率达11%,成交额为2.36亿元,市场交投活跃 [1] - 其跟踪的创业板人工智能指数成分股表现强势,其中易点天下上涨17.47%,中文在线上涨13.72%,易华录上涨12.44%,万兴科技、汉得信息等个股跟涨 [1] 政策与行业动态 - 工业和信息化部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》,提出实施工业互联网与人工智能融合赋能行动 [1] - 政策引导平台企业提升人工智能素养与技能,推动人工智能技术在工业全链条渗透,在规则明确场景推广判别式AI应用,在复杂场景探索生成式AI实践 [1] - 全球AI算力平台能力持续提升,英伟达在CES2026发布全面量产的NVIDIA Rubin平台,AMD公布“Helios”平台及MI400系列加速器产品组合,预示全球AI算力基础设施正加速迭代 [2] - 全球AI算力迭代趋势与大模型持续升级形成共振,将推动AI产业蓬勃发展 [2] 技术与产品进展 - 智谱联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是在中国国产芯片上完成全程训练的SOTA多模态模型 [1] - 该模型采用自主创新的“自回归+扩散解码器”混合架构,实现图像生成与语言模型的联合 [1] - 以KimiK2Thinking、DeepSeekV3.2为代表的国产大模型能力不断提升,有望加快在千行百业的落地进程,进一步促进我国AI产业发展 [2] 应用与商业化前景 - AI产业催化不断,AI应用商业化具备广阔发展空间,以生成式搜索(GEO)为代表的AI应用方向正在不断探索和发展 [2] - 除内容生成外,内容交互正成为重要突破点,对游戏等内容板块而言,AI在降本增效之外,为用户提供了独特的交互体验,显著提升了用户的参与感 [2] 产品与指数构成 - 创业板人工智能ETF南方(159382)紧密跟踪创业板人工智能指数,该指数反映创业板人工智能主题相关上市公司的股价变化情况 [2] - 创业板人工智能指数前十大权重股分别为中际旭创、新易盛、天孚通信、蓝色光标、协创数据、同花顺、润和软件、北京君正、润泽科技、昆仑万维 [2] - 该ETF设有场外联接基金,A类份额代码为024725,C类份额代码为024726 [3]
智谱高开超7%,联合华为开源首个国产芯片训练的多模态SOTA模型
格隆汇· 2026-01-14 10:24
公司股价与市场反应 - 智谱(2513.HK)股价于1月14日高开7.1%,报194.7港元 [1] 核心产品与技术发布 - 公司联合华为开源新一代图像生成模型GLM-Image [1] - 该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程 [1] - GLM-Image是首个在国产芯片上完成全程训练的SOTA多模态模型 [1] - 模型采用自主创新的“自回归+扩散解码器”混合架构,实现了图像生成与语言模型的联合 [1] - 此次发布是公司面向以Nano Banana Pro为代表的新一代“认知型生成”技术范式的一次重要探索 [1]