Workflow
昇腾NPU
icon
搜索文档
多款国产芯片Day0支持智谱GLM-5
观察者网· 2026-02-12 10:05
智谱AI发布并开源GLM-5大模型 - 智谱AI于2月11日上线并开源了其最新大模型GLM-5 [1] 国产芯片厂商完成Day0适配 - 多款国产芯片在GLM-5发布当天即宣布完成Day0适配,实现完全兼容和正常运行 [1] - 海光信息表示,其海光DCU通过深度协同与自研软件栈优化,使GLM-5在其硬件上实现高吞吐、低延迟的稳定运行 [1] - 摩尔线程基于SGLang推理框架,在其旗舰AI GPU MTT S5000上Day-0完成了全流程适配与验证,并深度释放了该卡的原生FP8加速能力 [1] 摩尔线程MTT S5000 GPU技术参数公布 - 摩尔线程首次公布了MTT S5000的算力参数,该卡基于第四代MUSA架构“平湖”打造 [1] - 其单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算 [1] GLM-5已完成与主流国产芯片平台的深度适配 - 智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化 [2] - 该模型能够在国产算力集群上实现高吞吐、低延迟的稳定运行 [2] GLM-5模型性能与技术创新 - 智谱GLM-5在Coding与Agent能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务 [2] - 模型参数规模从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,大幅提升通用智能水平 [2] - 模型构建了全新的“Slime”异步强化学习框架,支持更大模型规模及更复杂强化学习任务 [2] - 模型首次集成DeepSeek Sparse Attention稀疏注意力机制,在维持长文本效果无损的同时,大幅降低模型部署成本、提升Token Efficiency [2] 智谱AI近期其他模型发布 - 一个月前,智谱发布了图像生成模型GLM-Image,该模型采用“自回归+扩散解码器”混合架构,是面向“认知型生成”技术范式的一次重要探索,也是首个开源工业表现级离散自回归图像生成模型 [2] 华为昇腾对智谱AI的支持 - 华为计算方面表示,其昇腾NPU和昇思MindSpore AI框架为智谱AI提供了从数据到训练的全流程支撑,并提出一系列训练性能优化特性 [3] - 华为的技术助力智谱高性能训练出首个基于自主创新算力底座全程训练的SOTA模型 [3]
多款国产芯片宣布Day0支持智谱GLM-5
观察者网· 2026-02-12 09:59
智谱AI发布并开源GLM-5大模型 - 智谱AI于2月11日上线并开源了GLM-5大模型 [1] - 该模型在Coding与Agent能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务 [2] - 模型参数规模从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,大幅提升通用智能水平 [2] - 模型构建了全新的"Slime"异步强化学习框架,支持更大模型规模及更复杂强化学习任务 [2] - 模型首次集成DeepSeek Sparse Attention稀疏注意力机制,在维持长文本效果无损的同时,大幅降低模型部署成本、提升Token Efficiency [2] 国产芯片平台完成深度适配与优化 - 智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化 [2] - 模型能够在国产算力集群上实现高吞吐、低延迟的稳定运行 [2] - 海光DCU团队通过深度协同与自研软件栈优势,重点优化底层算子与硬件加速,使GLM-5在海光DCU上实现高吞吐、低延迟的稳定运行 [1] - 摩尔线程基于SGLang推理框架,在其旗舰级AI训推一体全功能GPU MTT S5000上,Day-0完成了全流程适配与验证 [1] - 摩尔线程打通了模型推理全链路,并深度释放MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用 [1] 国产AI芯片技术参数与性能披露 - 摩尔线程首次公布了MTT S5000的算力参数,该卡基于第四代MUSA架构"平湖"打造 [1] - MTT S5000单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算 [1] 智谱AI近期技术探索与发布 - 一个月前,智谱图像生成模型GLM-Image发布 [2] - GLM-Image模型采用"自回归+扩散解码器"混合架构,是智谱面向"认知型生成"技术范式的一次重要探索,也是首个开源工业表现级离散自回归图像生成模型 [2] 华为昇腾对模型训练的支持 - 华为计算方面表示,昇腾NPU和昇思MindSpore AI框架提供从数据到训练的全流程支撑,并提出一系列训练性能优化特性 [3] - 华为的技术助力智谱高性能训练出首个基于自主创新算力底座全程训练的SOTA模型 [3]
中国企业一年投3.9万亿夯实硬实力 华为“压强式”研发七大领域实现突破
长江商报· 2026-02-09 07:55
中国科技创新整体态势 - 2025年中国企业研发经费达3.93万亿元,稳居世界第二,研发投入强度为2.8%,首次超越OECD国家平均水平 [2] - 中国创新指数跻身全球前十,有效发明专利拥有量突破500万件,PCT国际专利申请量连续6年领跑全球 [2] - 政策、市场与主体同频共振,“十五五”开局将加速科技创新与产业创新深度融合 [7] 华为公司全方位突破 - 公司在算力、鸿蒙生态、通信网络、终端市场、智能汽车、数字能源、行业数字化七大领域实现硬核突破 [2][3] - 2025年华为手机全年出货量4680万台,市场份额17%,时隔五年重返中国市场第一,2026年1月市场份额达18.6%,继续位居第一 [3] - 公司通过鸿蒙智行“五界”模式构建智能汽车生态,实现跨越式增长 [3] - 公司推出搭载8192和15488颗昇腾NPU的Atlas 950/960 SuperPoD,支持百万卡级AI集群,昇腾384超节点累计部署量已突破300套,服务超20家客户 [4] - HarmonyOS在2025年结束“拓荒期”,在设备规模、应用生态和用户体验上实现规模化爆发与体验质变 [4] - 2025年上半年公司研发投入969.50亿元,自2019年至2025年上半年的六年半内,研发投入合计超过万亿元 [6] AI与算力产业链发展 - 工业富联深度绑定苹果、英伟达,转型为“全球AI算力基建供应商”,其AI服务器全球代工市占率超35%,800G高速交换机市占率达73.8%,承接全球85%的AI服务器出货量 [5] - 2025年度,工业富联预计实现归母净利润351亿元至357亿元,同比增加119亿元至125亿元,同比上升51%至54%,股价区间涨幅近3倍,成为万亿市值公司 [5] - 寒武纪经过10年攻关实现AI芯片国产化突破,预计首次实现年度盈利,其股价在2025年超过贵州茅台成为A股“股王” [2][4] 互联网与科技企业AI战略 - 阿里巴巴宣布未来三年投入3800亿元建设云和AI硬件基础设施,并深度聚焦AI+云及电商核心业务 [2][6] - 公司通过“通义千问”串联淘宝闪购、支付宝、淘宝、盒马、飞猪、高德等应用,构成AI生态场景,并推出“春节30亿免单”计划加入AI入口争夺战 [2][6] 生物医药产业升级 - 恒瑞医药从以仿制药为营收支柱转向创新,创新药收入占比突破60%,I类新药频频“借船出海” [2][6] 商业航天产业进展 - 2025年政策、技术、资本等要素共振,中国民营商业航天公司迎来IPO集体起跑,其中蓝箭航天进度最为靠前,加速冲击“商业航天第一股” [2][4] 研发投入与产业支撑 - 2025年前三季度,中国上市公司合计研发投入1.16万亿元 [6] - 巨额研发投入正推动中国科技创新从量的积累走向质的飞跃 [6]
在白山黑水之间,书写振兴东北的数智新篇
环球网资讯· 2025-12-18 15:55
黑龙江数智化转型的战略定位与机遇 - 黑龙江将基于算电融合的人工智能创新发展确立为“十五五”时期经济发展的核心引擎 [1] - 作为国家“东数西算”工程中的算力枢纽节点,其算力需求与富集的电力资源在都市圈内高度集中,为构建绿色高效的新型智算中心提供理想土壤 [1] - 拥有哈尔滨工业大学、哈尔滨工程大学等高等学府构成的人才“蓄水池”,为人工智能与计算产业输送储备力量 [1] - 从智慧农业到智能制造,拥有丰富的应用场景为数智化转型提供试验场 [1] - 与东部沿海地区相比,数字经济起步较晚,产业数字化基础较为薄弱,“数字鸿沟”客观存在 [2] - 许多传统企业尤其是中小企业在转型中面临技术门槛高、资金投入大、人才匮乏等现实困境 [2] - 数智基础设施在算力调度效率、数据要素流通、产业链协同等方面仍有巨大提升空间 [2] 华为与黑龙江的合作框架与赋能路径 - 华为公司高级副总裁表示,愿意将在计算、通信、能源、云和人工智能等领域的技术积累和生态资源,与黑龙江的独特优势和战略需求紧密结合 [3] - 华为为黑龙江带来的是一套涵盖计算、通信、能源、云及人工智能的全栈创新技术与庞大的产业生态资源 [3] - 针对黑龙江作为8+3算力枢纽节点算电协同示范省份的定位,华为提出基于构网型技术,通过光风储协同恒功率让新能源具备同步机组外特性,为算力提供稳定绿电 [3] - 基于昇腾 NPU、灵衢架构的超节点方案,构建资源池化、绿色低碳的 AIDC,打造面向各行业的超节点场景解决方案 [3] - 与中国铁路哈尔滨局集团共建联合创新实验室,聚焦铁路核心业务场景,用自主创新根技术和 AI 能力打造标准化解决方案 [4] - 与哈尔滨工程大学共建人工智能实习实践基地,以“产教融合”理念搭建人才培养平台 [5] - 成立“AI使能数智化发展产业联盟”并发布“算-电-AI”三位一体协同生态倡议,旨在汇聚力量打通从技术研发到产业应用的壁垒 [5] 数智化转型的具体实践案例 - “龙政智数”政务大模型实现了“四统一”统筹管理,构建模型训练、管理和应用三大中心 [6] - 该千亿级参数的政务智能中枢已深度集成到13个市(地)的300余个业务系统中,累计解决四万多个业务问题 [6] - 智慧物流企业哒哒智运在华为技术支持下,构建基于“数字赋能+规则重构”的智慧物流平台 [6] - 通过引入华为云、AI及物联网等技术,打通汽运、铁运、海运及仓储的独立系统,构建多式联运一体化平台 [6] - 黑龙江东方学院与华为共建现代产业学院,将人工智能、鸿蒙生态等前沿技术课程体系、认证标准及真实项目案例引入校园 [7] - 黑龙江鲲鹏生态创新中心已吸引超70家上下游企业合作,完成了200多个软件的适配认证 [7] - 该中心面向从K12学生到高校开发者、企业工程师的全社会群体开展科普、实训与认证,构建本地计算产业生态圈 [7]
宏观策略周报:2025世界人工智能大会描绘AI新未来,7月制造业PMI为49.3%-20250801
源达信息· 2025-08-01 18:47
核心观点 - 2025世界人工智能大会(WAIC)展示AI技术突破与全球合作愿景,聚焦算力集群、人形机器人等前沿领域,推动产业智能化升级[11][23][24] - 7月制造业PMI为49.3%,环比下降0.4个百分点,但生产指数(50.5%)仍处扩张区间,大型企业(50.3%)和新动能行业保持韧性[19][22] - 1-6月规模以上工业企业利润同比下降1.8%,但6月单月降幅收窄至4.3%(较5月改善4.8个百分点),装备制造业利润同比增长9.6%[14][17][18] 资讯要闻 政策动态 - 中共中央政治局会议部署下半年经济工作,强调"持续发力、适时加力"的宏观政策基调,重点包括提振消费(培育服务消费新增长点)、反内卷式竞争治理及统一大市场建设[9][10] 行业事件 - 2025WAIC规模创新高:展览面积突破7万平方米,覆盖AWS、Google、华为等300+企业,展示昇腾NPU集群(算力300 PFlops)等核心技术[11][23] - 国务院总理提出AI发展三大方向:普及普惠(智能平权)、创新合作(联合技术攻关)、共同治理(全球框架构建)[12][13] 市场表现 指数与行业 - 主要指数分化:科创100周涨0.5%(年初至今+22%),沪深300周跌1.8%[25][26][28] - 申万行业涨幅前三:医药生物(+2.9%)、通信(+2.5%)、传媒(+1.1%)[28] - 热点板块:光模块(CPO)周涨7.96%,创新药涨5.3%;稀土永磁跌5.62%[32] 产业数据 制造业 - 6月装备制造业利润同比+9.6%,其中汽车行业利润增长96.8%,电气机械/仪器仪表分别增长18.7%/12.3%[17][18] - 7月PMI结构:生产指数50.5%(环比-0.5pct),新订单指数49.4%(环比-0.8pct),原材料库存指数47.7%[22] 投资建议 - **新质生产力**:聚焦人工智能(算力集群/ASIC芯片)、人形机器人(关节模组技术)、创新药、低空经济等[3][23][24] - **消费复苏**:关注汽车(6月行业利润+96.8%)、家电、新消费场景[3][18] - **防御配置**:高股息资产、黄金(地缘避险需求)[3][33]
突发,午后跳水!超4200只个股下跌,周期股跌麻了!一则重磅消息,这个板块逆市拉升...
雪球· 2025-07-31 16:25
市场整体表现 - 上证指数跌1.18%,深证成指跌1.73%,创业板指跌1.66% [1] - 沪深两市成交额约19360亿元,较前一个交易日放量约917亿元,全市场超4200只个股下跌 [2] 周期股集体回调 - 钢铁、油气、能源金属、煤炭等板块领跌,钢铁板块跌超3%,有色金属、煤炭板块跌超2% [5] - 个股方面,安阳钢铁、包钢股份跌超7%,云南锗业、北方稀土大跌超5% [5] - 期货市场多个品种大幅回落,玻璃、焦煤主力合约大跌8%,多晶硅跌超7%,纯碱、工业硅跌超6%,碳酸锂跌近5% [7] - 广期所调整工业硅、多晶硅、碳酸锂期货部分合约交易限额,单日开仓量不得超过500手 [7][8] 国产替代走强 - 国家网信办约谈英伟达公司,要求其对H20算力芯片漏洞后门安全风险问题进行说明 [10] - 国产替代概念冲高,东芯股份3连板,寒武纪盘中一度涨超7%,华虹公司、海光信息、中芯国际等快速冲高 [10] - 摩尔线程、沐曦集成电路发布招股说明书,摩尔线程计划募资80亿元用于GPU研发及市场拓展 [12] - 华为发布CloudMatrix384AI超节点,算力提升50倍,推理吞吐量提升近4倍,时延降低至50ms以下 [13] 婴童概念延续强势 - 阳光乳业、安正时尚走出3连板,共同药业、汉商集团涨停 [15] - 中央财政设立"育儿补贴补助资金",今年初步安排预算900亿元左右 [16] - 北京市发布15项措施完善生育支持政策体系,包括建立生育补贴制度等 [16]
直线飙涨!刚刚,重磅突发!
券商中国· 2025-07-31 13:59
英伟达被约谈事件 - 国家网信办约谈英伟达,要求其对华销售的H20算力芯片漏洞后门安全风险问题进行说明并提交证明材料 [1][2] - 英伟达H20芯片被曝存在"追踪定位"和"远程关闭"技术,可能威胁中国用户网络安全和数据安全 [2] - 美国白宫批准英伟达恢复向中国出口H20芯片,该芯片是专为中国市场设计的降级版AI芯片,性能远低于国际市场主流H100 [4][5] - 此前美国对H20芯片实施禁售导致英伟达面临45亿美元库存损失和55亿美元减值,市值一度蒸发1600亿美元 [5] 国产替代概念股表现 - 寒武纪短线拉升一度涨超7%,成交额超47亿,华为海思概念股如神州数码涨超6%,卓易信息涨超4% [1][6] - 国内GPU企业摩尔线程和沐曦集成电路发布招股说明书,加速国产GPU发展 [6] - 摩尔线程科创板IPO申请获受理,计划募资80亿元用于GPU研发及市场拓展,2022-2024年研发费用累计达38亿元 [6] 华为AI算力突破 - 华为发布CloudMatrix384AI超节点,算力提升50倍至300pFLOPS,单卡推理吞吐量提升近4倍至每秒2300token [7] - 支持混合专家MoE大模型推理,实现384个专家并行推理,推理时延从100ms降低至50ms以下 [7] 国内GPU行业动态 - 摩尔线程自主研发全功能GPU,覆盖AI智算和图形渲染领域,采用自研MUSA架构和先进制程技术 [6] - 沐曦股份是国内高性能通用GPU领军企业,国产替代进程有望提速 [6]
华为首个开源大模型来了!Pro MoE 720亿参数,4000颗昇腾训练
华尔街见闻· 2025-06-30 15:27
华为盘古大模型开源 - 公司首次开源盘古大模型核心能力,包括70亿参数稠密模型和720亿参数混合专家模型(盘古Pro MoE),同时开放基于昇腾的模型推理技术 [1] - 盘古Pro MoE在昇腾800I A2上实现单卡1148 tokens/s推理吞吐,通过投机加速技术可提升至1528 tokens/s,优于同等规模稠密模型 [3][11] - 开源组件包括盘古Pro MoE 72B模型权重、基础推理代码及昇腾超大规模MoE推理代码,盘古7B相关资源将于近期上线 [4] 模型架构与技术特性 - 盘古Pro MoE基于MoGE架构构建,总参数量720亿,激活参数量160亿,针对昇腾硬件优化,在昇腾300I Duo服务器上提供高性价比推理方案 [4][11] - 引入"快思考"和"慢思考"双系统,简单问题快速响应,复杂问题深度推理,专家选择采用分组机制实现跨设备负载均衡 [9] - 预训练使用4000个昇腾NPU处理13万亿tokens语料,后训练通过SFT和RL增强推理能力,采用检查点合并优化模型 [11] 性能表现与基准测试 - 在千亿参数内模型中处于领先地位,MMLU-PRO英文基准显著超越Qwen3-32B、GLM-Z1-32B等主流稠密模型及Llama4-Scout MoE模型 [12] - 中文领域C-Eval(EM)得分91.1超越Qwen3-32B(89.2),CLUEWSC(EM)94.7微幅领先Qwen3-32B(94.6) [14][15] - 代码生成MBPP+(Pass@1)达80.2接近Qwen3-32B(82.0),数学推理MATH-500得分96.8超越Qwen3-32B(96.6) [15] 行业影响与生态整合 - 公司形成昇腾NPU芯片、MindSpore框架、盘古模型的垂直整合体系,被媒体评价为"工业奇迹",提供英伟达之外的替代方案 [18] - 国产大模型开源浪潮加速,MiniMax、阿里巴巴等厂商推动模型价格下降60%-80%,华为开源有望进一步促进行业应用普及 [20] - SuperCLUE测评显示盘古72B在开源榜排名第五(58.75分),超越Qwen3-14B/8B,仅次于DeepSeek和Qwen3-32B/235B [17]
训练大模型,终于可以“既要又要还要”了
虎嗅APP· 2025-05-29 18:34
华为Pangu Ultra MoE模型技术突破 - 华为推出参数规模高达718B的准万亿MoE模型Pangu Ultra MoE 该模型融合计算、通信和内存等多维度指标 在昇腾NPU平台上实现最佳平衡 [6] - 模型采用256个路由专家 每个token激活8个专家 总参数量718B 激活量39B 具有超大规模和超高稀疏比特性 [6] - 引入MLA注意力机制 有效压缩KV Cache空间 缓解推理阶段内存带宽瓶颈 优于传统GQA方案 [6] 模型架构创新 - 采用Depth-Scaled Sandwich-Norm稳定架构和TinyInit小初始化方法 使梯度突刺率从1.54%下降到0.76% 相对下降51% [13][17] - 设计EP-Group负载均衡loss 相比主流Micro-batch方案在大部分任务上平均提升1.5个点 [20][21] - 采用单头MTP进行训练 后续复用参数扩展至多头结构 实现多Token投机推理 接受长度提升约38% [26][27] 训练方法优化 - 全流程采用dropless训练模式 避免Drop&Pad训推不一致问题 提升训练数据效率 [7] - 预训练阶段在6k到10k张NPU上进行 具备128k长序列能力 [8] - 采用迭代难例挖掘与多能力项均衡的奖励函数 参考GRPO算法提升训练效率与推理性能 [29][31] 昇腾硬件亲和设计 - 隐藏维度设置为7680维 精准匹配DaVinci芯片的16×16 MatMul单元 充分发挥计算潜力 [7] - 设置61层Transformer结构 预留额外MTP层空间 保障计算负载均衡的流水线调度 [7] - 路由专家数量设为256 在TP×EP并行下提升All-to-All通信效率 加速分布式训练 [7] 模型性能表现 - 在C-Eval评测中得分90.8 CLUEWSC得分94.8 MMLU得分91.5 整体效果优于主流模型 [9] - 在推理能力评测中 AIME2024得分81.3 GPQA-Diamond得分75.3 MATH500得分97.4 [9] - 强化学习训练系统有效解决了多能力协同提升问题 保持模型在数学、代码和通用能力的均衡表现 [31]
Bye,英伟达!华为NPU,跑出了准万亿参数大模型
量子位· 2025-05-08 12:04
华为昇腾NPU技术突破 - 华为基于昇腾国产算力平台成功训练7180亿参数MoE模型,突破万亿参数大模型训练瓶颈 [4][5] - 采用6000+块昇腾NPU集群实现长期稳定训练,算力利用率(MFU)达30%,较优化前提升58.7% [4][33] - 攻克负载均衡难、通信开销大、训练效率低等四大技术挑战 [8][9][10] 模型架构优化 - 采用细粒度专家加共享专家范式,通过hidden size调整提升算力利用率13% [12][13] - 设计TP8×EP4超融合并行方案,运用TP-extend-EP技术避免算子效率下降 [14] - 张量256对齐处理完美匹配16×16矩阵计算单元,释放NPU算力 [15] - 参数搜索空间从庞大范围缩小至10000个左右,建模仿真工具准确率达85% [17] 训练效率提升 - 创新EP组负载均衡损失算法,在20B先导模型验证效果 [24][26] - 采用dropless方案优化并行策略,空泡率从18.98%降至10.49% [33][39] - 实现16路流水线并行、8路张量并行、4路专家并行、2路虚拟流水线并行及48路数据并行 [35] - 专家组总数32组划分256个专家,任务分配不均衡控制在5%以内 [38][39] 通信与显存优化 - 分级EP通信技术减少跨机通信量,Allgather同步结合机内AlltoAll重分配 [42][43][44] - 自适应前反向掩盖策略实现机内外通信互相掩盖,缓解host bound问题 [46][48] - 细粒度模块重计算结合Tensor Swapping技术优化显存使用 [51] - 动态负载均衡机制通过贪心算法预测调整专家分配,MFU提升10% [53][54] 性能表现 - 在CLUEWSC(94.8分)、MMLU(91.5分)、AIME2024(81.3分)等基准测试表现优异 [61] - 与DeepSeek-R1等MoE模型相比,在数学推理(MATH500 97.4分)等任务展现竞争力 [62] - 专家差异化显著,共激活现象少,冗余度低,增强模型表达能力 [65][66][72] - 路由专家与共享专家贡献均衡,协同提升模型表征能力 [68][70] 行业影响 - 标志国产算力平台进入AI大模型训练世界领先行列 [73] - 展示中国科技自主创新能力,实现从跟跑到并跑甚至领跑的跨越 [74] - 为千行百业智能化转型提供技术支撑,助力占据科技革命制高点 [74]