昇腾AI云服务

搜索文档
华为云CloudMatrix 384超节点再出圈,昇腾AI云服务解锁超级算力
观察者网· 2025-07-28 15:15
华为384超节点技术突破 - 华为384超节点真机荣获WAIC 2025"镇馆之宝"奖项,其CloudMatrix 384超节点支持的昇腾AI云服务因弹性灵活按需取用特性成为焦点[1] - 超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过MatrixLink全对等互联,形成算力达300 PFlops的超级AI服务器,突破跨机通信带宽瓶颈[3] - 昇腾AI云服务降低企业使用先进智算门槛,直接提供成熟软件栈和工具链,加速大模型研发与部署[3] CloudMatrix 384超节点技术特点 - 吞吐性能强:单卡Decoding吞吐达2300Tokens,软硬件协同优化[4] - 覆盖160+行业主流模型,高效支撑模型迁移[4] - 国内首创大规模专家并行方案,实现系统级优化,降低decode时延[4] - 初始投资小,每年迭代新版本,弹性按需使用[4] 行业应用案例 - 新浪"智慧小浪"推理效率提升50%以上,硅基流动每日服务600万用户推理[4] - 中科院自研AI4S科研大模型,面壁智能"小钢炮"模型推理性能大幅提升[4] - 360"超级搜索"纳米AI搜索采用该算力,讯飞大模型实现极致推理性能[4] 具身智能与垂直行业解决方案 - CloudRobo具身智能平台结合多模态生成大模型等能力,上海国地中心应用后数据采集成本降低90%[8] - 与北铁所合作铁路大模型及高铁智能巡检机器人,助力中国铝业打造有色金属行业首个大模型"坤安"[10] - "AI+气象"方案提升新能源发电效率,AI工业链赋能智能制造,钢铁热轧实现毫米级控制[10] 智能产品展示与未来规划 - 展区推出智能中医把脉仪、戴盟机器人、内置大模型的鸿蒙电脑等产品[10] - 公司将持续通过"尖刀技术"与垂直解决方案推动AI与产业深度结合[10]
“中国云谷”再添新翼 和林格尔新区迎来华为北方最大AI智算中心
搜狐财经· 2025-07-15 21:37
和林格尔新区发展 - 华为云华北(和林格尔)数据中心正式开服,进一步夯实和林格尔新区作为"中国云谷"的核心地位,向"世界算谷"目标迈进 [1] - 新区作为国家"东数西算"工程核心枢纽节点,已汇聚46个数据中心项目,总算力规模达10.1万P [3] - 新区凭借年平均7℃气温实现数据中心全年近300天自然冷却,"绿电"使用率超80% [3] 华为云数据中心技术优势 - 华为云和林格尔数据中心是华为在北方区域规模最大的云基础设施,服务器装机能力超300万台 [3] - 该中心是华为云在北方首批超节点AI智算中心,将应用风冷、液冷与AI调优技术,液冷区域年均PUE预计低于1.1 [3] - 中心搭载基于CloudMatrix 384创新架构的新一代昇腾AI云服务,提供稳定可靠、极低时延的AI算力 [3] 产业影响 - 华为云数据中心将面向华北及全国加速政务、工业、汽车、金融等行业的智能升级 [3] - 项目落地为和林格尔新区算力产业生态增添关键一笔,巩固其国家算力战略布局中的核心枢纽地位 [4]
青城聚智算力兴 绿算新篇启未来 ——“中国云谷”迈向新高度
中国产业经济信息网· 2025-07-14 13:46
大会概况 - 2025绿色算力(人工智能)大会在呼和浩特召开,主题为"共筑绿色算力大生态 共创人工智能新未来",汇聚500多名行业嘉宾[1] - 大会发布《呼和浩特市人民政府关于促进绿色算力及人工智能产业高质量发展的若干意见》,提供政策指引[1] 算力中心项目 - 五个大型算力中心项目点亮运营,包括京能"京数蒙算"、中国农业银行数据中心、华为云数据中心、火山引擎算力中心、并行科技算力基地,呼和浩特算力规模达10.1万P[2] - 全国首个绿色算电协同产业基地启动,包含120MW/480MWh共享储能基地、2个10万卡数据中心集群、信创及智算服务器生产基地等[2] 绿色算力发展 - "全国一体化算力网"算电协同国家试点项目通电并网,年供电量7.9亿千瓦时,降低能耗9.7万吨标准煤,减少二氧化碳排放55.6万吨[3] - 和林格尔集群多云算力资源监测与调度平台接入全国一体化算力网络资源监测平台,已达成八千万算力交易额[4] 金融与科技融合 - 和林格尔金融数据产业园授牌,吸引中国银行、农业银行、建设银行等金融机构落地,成为国内规模最大、业态最丰富的金融科技集聚区[4] - 四个实验室揭牌,包括内蒙古量子信息创新工程中心、寒武纪液冷AI服务器测试实验室等,助力智算产业生态建设[5] 技术创新成果 - 华为基于CloudMatrix384超节点的北方首个新一代昇腾AI云服务上线,标志AI技术迈向系统性领先[7] - 和林格尔集群发布全国首个"东数西算"绿色算力产业风险解决方案,中国资源循环集团发布"算力资产资源绿色循环"解决方案[7] 重大项目签约 - 10个重点项目签约,总投资约200亿元,涵盖算力基础设施、人工智能应用、数据产业生态等领域[8] - 重点项目包括内蒙古自治区与百度合作协议、京蒙数据产业协同发展战略协议等[8] 行业专家观点 - 中国工程院院士高文、国家信息中心副主任周民等业界权威人士围绕绿色算力与人工智能的融合创新发表见解[9]
2025绿色算力(人工智能)大会召开 呼和浩特展示绿色算力“硬实力”
内蒙古日报· 2025-07-13 16:55
大会概况 - 2025绿色算力(人工智能)大会于7月12日在呼和浩特举行,主题为"共筑绿色算力大生态 共创人工智能新未来",旨在推动国家"东数西算"战略实施 [4] - 大会由呼和浩特市政府主办,中国信通院、内蒙古和林格尔新区管委会等共同承办 [4] 关键成果发布 - 和林格尔集群多云算力资源监测与调度平台接入全国一体化算力网资源监测平台,内蒙古成为全国首个实现省级算力网与国家算力网联通的省份 [4] - 全国首个绿色算电协同产业基地启动,全国一体化算力网算电协同国家试点项目通电并网运行 [4] - 和林格尔金融数据产业园授牌,集聚中农建交等金融机构数据中心,成为国内规模最大、业态最丰富的金融科技集聚区 [5] - 四大前沿实验室揭牌:内蒙古量子信息创新工程中心、中科国算AI应用研究实验室、寒武纪液冷AI服务器测试实验室、中科仙络液冷测试实验室 [5] 重点项目运营 - 五大重点数据中心项目点亮运营,包括中国农业银行数据中心、华为云数据中心、火山引擎算力中心等,推动呼和浩特算力总规模达10.1万P,智算占比超95% [5][6] 研究报告发布 - 中国信通院发布《绿色算力发展研究报告(2025)》,清华大学发布《"东数西算"枢纽节点绿色算力指数研究报告》,显示和林格尔新区绿色算力发展指数连续两年全国第一 [6] - 呼和浩特市政府发布《关于促进绿色算力及人工智能产业高质量发展的若干意见》及配套实施细则 [6] 创新方案发布 - 华为上线北方首个基于CloudMatrix384超节点的新一代昇腾AI云服务 [7] - 人保财险推出全国首个"东数西算"绿色算力产业风险解决方案 [7] - 海天瑞声发布具身智能数据工程化服务平台,云天畅想发布全国最大AI云电竞平台 [7] 产业生态建设 - 上游:构建"绿电+算力设备"双轮驱动,成立算电数字设备制造产业园,引进华电、新华三等企业,用电成本全国最低 [8] - 中游:形成"算力供给-输出调度-基建支撑"生态体,集聚46个数据中心项目,算力规模10.1万P [8] - 下游:围绕人工智能"全生态"创新突破,城市大脑接入109家单位353个信息化系统 [8] 项目签约 - 10个项目现场签约,包括百度、联想、悟索智驾等,协议总投资200亿元,覆盖AI研发、数据协同、智能装备制造等领域 [9] 专题会议 - 八大国家枢纽节点及十大数据中心集群代表研讨算力产业高质量发展 [11] - 华为、新华三、中国电信等头部企业主办9场专题会议,覆盖算力产业上中下游技术攻关与应用落地 [11]
中银晨会聚焦-20250703
中银国际· 2025-07-03 10:41
报告核心观点 - 美国对先进芯片进口限制持续,促使国产算力替代进程加快;国内云厂商持续提升相关资本开支并逐步释放产业需求;国内AI大模型及应用迭代推动算力需求提升,国产算力高景气持续 [3][7] 市场表现 市场指数表现 - 上证综指收盘价3454.79,跌0.09%;深证成指收盘价10412.63,跌0.61%;沪深300收盘价3943.68,涨0.02%;中小100收盘价6512.36,跌0.62%;创业板指收盘价2123.72,跌1.13% [4][6] 行业表现(申万一级) - 钢铁涨3.37%、煤炭涨1.99%、建筑材料涨1.42%、农林牧渔涨0.84%、银行涨0.75%;电子跌2.01%、通信跌1.96%、国防军工跌1.94%、计算机跌1.64%、美容护理跌1.09% [5] 7月金股组合 - 滨江集团(002244.SZ)、顺丰控股(002352.SZ)、极兔速递 - W(1519.HK)、卫星化学(002648.SZ)、安集科技(688019.SH)、海优新材(688680.SH)、合锻智能(603011.SH)、黄山旅游(600054.SH)、胜宏科技(300476.SZ)、南亚新材(688519.SH) [6] 国产算力发展情况 华为昇腾推动国产算力发展 - 2025年6月22日乌鲁木齐疆算科技发展有限公司招标显示,智算中心项目拟采用4500台昇腾910C - 2服务器机群等,预计建成后满足20000P算力使用 [7] - 昇腾910C采用特殊封装设计,单芯片算力高达320TFLOPS(FP16),适用于AI任务,支持大模型训练和推理的数据处理 [7] - 华为6月宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,昇腾通过“一平台双驱动”模式构建完整技术生态链,拥有200多家合作伙伴、超30万开发者以及100多所高校课程支持 [7] 国内云厂商及运营商驱动国产算力市场景气 - 阿里未来三年规划3800亿元投入云建设和AI硬件基础设施,1Q25资本支出246亿元,同比增长119.6%,AI相关收入连续7个季度三位数增长 [8] - 腾讯计划2025年资本开支占收入百分比为低两位数,1Q25资本开支达275亿元,同比增长91%,算力投入重点投向大模型训练与推理资源 [8] - 2025年三家电信运营商资本开支均向算力倾斜,国产服务器占比逐年升高,中国电信2024年达约67.5% [8] 应用端推理打开国产算力市场空间 - DeepSeek技术突破降低应用端门槛,Agent技术和产品日趋成熟,推理侧需求有望成AI算力支出主驱动力 [9] - Alphabet 1Q25推理约634万亿tokens,到2025年4月月推理量升至480T,较一年前增长50倍;截至2025年5月底,字节豆包大模型日均tokens使用量超16.4T,较去年5月增长137倍 [9]
计算机行业周报:谷歌发布全新多模态大模型Gemma3n,阿里达摩院发布医疗AI模型DAMOGRAPE-20250630
华鑫证券· 2025-06-30 20:43
报告行业投资评级 - 推荐(维持)[2] 报告的核心观点 - 算力租赁价格较为平缓,谷歌发布适合边缘设备运行的全新多模态大模型Gemma 3n [3][15][16] - Kimi周平均停留时长环比+58.70%,阿里达摩院发布全球首个利用平扫CT识别早期胃癌的AI模型DAMO GRAPE [3][27][28] - 法律科技公司Harvey完成3亿美元E轮融资,估值达50亿美元 [4][39] - 本周AI算力指数、AI应用指数等有涨有跌,部分公司涨幅或跌幅较大 [44] - 近期关注国产算力机会,中长期关注嘉和美康、科大讯飞等公司 [51][52] 根据相关目录分别总结 算力动态 - 数据跟踪:本周算力租赁价格较平缓,如显卡配置为A100 - 40G中,腾讯云16核+96G价格为28.64元/时;A800 - 80G中,恒源云16 + 256G价格环比上周降12.77% [15][18] - 产业动态:6月27日谷歌发布并开源全新端侧多模态大模型Gemma 3n,为端侧设备提供多模态功能,具有多模态设计、专为设备端优化等特性,其核心MatFormer架构有独特优势,还采用了PLE技术和键值缓存共享等 [16][17][19] AI应用动态 - 周流量跟踪:2025.6.20 - 2025.6.26期间,访问量前三位为ChatGPT、Bing和Canva,平均停留时长环比增速第一为Kimi,达58.70% [27][29] - 产业动态:6月25日阿里达摩院发布医疗AI模型DAMO GRAPE,突破传统影像学限制,可利用平扫CT识别早期胃癌,在全国大规模临床研究证明其有望提升胃癌检出率,已在部分地区部署并推广,未来探索“一扫多查” [28][31][32] AI融资动向 - 6月24日法律科技公司Harvey完成3亿美元E轮融资,估值达50亿美元,其AI平台服务全球多国律所及机构,年度经常性收入增长,核心产品能处理法律工作,融资后计划扩大团队、拓展业务 [4][39][40] 行情复盘 - 本周(6.23 - 6.27日),AI算力指数/AI应用指数/万得全A/中证红利日涨幅最大值分别为2.82%/2.55%/1.56%/0.34%,AI应用指数/万得全A/中证红利日跌幅最大值分别为 - 0.23%/-0.28%/-0.52%;AI算力指数内部*ST云创涨幅最大,AI应用指数内部恒银科技涨幅最大、完美世界跌幅最大 [44] 投资建议 - 近期关注国产算力机会,华为开发者大会2025上线新一代昇腾AI云服务,国产算力链有望价值重估 [51] - 中长期关注临床AI产品成功落地验证的嘉和美康、以AI为核心的龙头厂商科大讯飞等多家公司 [52]
华为首个!重磅发布!
新华网财经· 2025-06-30 15:48
华为开源盘古大模型 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B)[1] - 同步开源基于昇腾的模型推理技术 旨在推动大模型技术研究与创新发展 加速AI在千行百业的应用[1] 盘古Pro MoE 72B性能表现 - 参数量720亿 激活参数量160亿 通过动态激活专家网络设计实现以小打大 性能媲美千亿级模型[3] - 在Super CLUE 2025年5月排行榜中 位居千亿参数量以内大模型国内并列第一[3] 华为大模型技术进展 - 6月20日发布盘古大模型5.5 包含五大基础模型 覆盖NLP 多模态 预测 科学计算 计算机视觉领域[4] - 推出Cloud Matrix384超节点昇腾AI云服务 单卡推理吞吐量达2300Tokens/s 提供高性能算力支持[4] - 5月30日发布7180亿参数的盘古Ultra MoE 全流程在昇腾平台训练 披露技术细节体现训练性能跨越[4] 昇腾全栈自主可控能力 - 盘古大模型基于昇腾云全栈软硬件训练 实现国产算力+国产模型全流程自主可控[5] - 集群训练系统性能业界领先 完成从硬件到软件 从训练到优化 从研究到落地的全栈国产化闭环[5] 华为大模型行业战略 - 坚持"不作诗 只做事"战略 聚焦为千行万业解难题 盘古大模型已在30多个行业500多个场景落地[7] - 发布五大行业思考大模型(医学 金融 政务 工业 汽车) 推动行业智能化升级[7] - 开源举措有助于扩展昇腾生态 吸引垂直行业基于盘古打造解决方案 深化大模型行业赋能[7]
华为首个!重磅发布!
证券时报· 2025-06-30 12:37
华为开源大模型技术 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B模型性能 - Pro MoE 72B模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为开发者大会2025发布内容 - 公司发布盘古大模型5.5,包含五大基础模型,分别面向NLP、多模态、预测、科学计算、计算机视觉领域 [3] - 同时发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [3] 盘古Ultra MoE模型 - 公司推出参数规模高达7180亿的盘古Ultra MoE模型,是全流程在昇腾AI计算平台上训练的准万亿MoE模型 [4] - 发布该模型架构和训练方法的技术报告,披露众多技术细节 [4] 全栈国产化成果 - 盘古大模型基于昇腾云的全栈软硬件训练而成,实现从硬件到软件、从训练到优化的全流程自主可控 [4] - 在集群训练系统性能上实现业界领先,完成国产AI基础设施自主创新能力的验证 [4] 行业应用成果 - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 五大盘古行业思考大模型(盘古医学、盘古金融、盘古政务、盘古工业、盘古汽车)同步上线 [4] 开源战略意义 - 开源盘古模型有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [5] - 吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型赋能千行百业 [5]
华为首个!重磅发布!
证券时报· 2025-06-30 12:12
华为开源盘古大模型 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B性能表现 - 开源的Pro MoE 72B大模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为大模型技术进展 - 公司在2025年华为开发者大会上发布盘古大模型5.5,包含五大基础模型面向NLP、多模态、预测、科学计算和计算机视觉领域 [4] - 会上还发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [4] - 5月30日公司推出参数规模高达7180亿的盘古Ultra MoE模型,并发布相关技术报告 [4] 昇腾生态与国产化突破 - 盘古大模型基于昇腾云全栈软硬件训练完成,实现国产算力+国产模型全流程自主可控 [5] - 公司在集群训练系统性能上实现业界领先,完成从硬件到软件、从训练到优化的全栈国产化和全流程自主可控闭环 [5] 行业应用与落地 - 公司坚持"不作诗,只做事"战略,为千行万业提供智能化解决方案 [5] - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 公司同步上线五大盘古行业思考大模型(医学、金融、政务、工业、汽车) [5] 开源战略意义 - 开源举措有助于更多开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [7] - 开源将吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型更广泛赋能行业 [7]
华为开源盘古7B稠密和72B混合专家模型
观察者网· 2025-06-30 10:38
模型开源与生态战略 - 公司正式开源盘古70亿参数稠密模型和盘古Pro MoE 720亿参数混合专家模型,并发布基于昇腾的模型推理技术 [1] - 此举是公司推进昇腾生态战略的关键举措,旨在推动大模型技术研究创新和AI行业应用 [1] - 盘古Pro MoE 72B模型权重和基础推理代码已上线开源平台,盘古7B相关模型将于近期上线 [1] - 公司计划首先开源盘古72B MoE模型,其次可能向高校开源小模型 [2] 模型性能与技术优势 - 盘古Pro MoE大模型在720亿参数、激活160亿参数情况下,性能可媲美千亿级模型 [1] - 该模型在SuperCLUE 2025年5月排行榜中位列千亿参数以内大模型国内第一 [1] - 盘古72B被专家称为"兼顾性能与推理成本的黄金尺寸",适合行业AI改造 [1] - 公司推出7180亿参数的盘古Ultra MoE新模型,全流程在昇腾AI计算平台训练 [2] - 盘古718B Ultra MoE万卡集群预训练MFU达到41%,实验室达45% [3] - CloudMatrix384超节点训练MoE大模型MFU超过50% [3] 技术架构与优化 - 昇腾超节点采用全对等高速互联架构,通过系统工程方法实现计算、内存、通信的极致优化 [3] - 结合昇腾特点的亲和设计和数学算法创新,实现超级并行 [3] - 欧拉操作系统优化升级将支持资源池化管理与调度,提升训练效率和推理性能 [3] 产品升级与服务 - 公司发布盘古大模型5.5,升级NLP、CV、多模态等五大基础模型 [3] - 基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线 [3] 生态建设与兼容性 - 昇腾算力能够训练世界一流大模型,具有训练高效率、推理高性能、系统高可用特点 [2] - 第三方模型可做到Day0迁移和一键部署到昇腾平台 [2] - 昇腾生态正在逐步完善,包括对业界主流生态的兼容 [2]