Workflow
华为云CloudMatrix 384超节点
icon
搜索文档
华为云CloudMatrix 384超节点再出圈,昇腾AI云服务解锁超级算力
观察者网· 2025-07-28 15:15
华为384超节点技术突破 - 华为384超节点真机荣获WAIC 2025"镇馆之宝"奖项,其CloudMatrix 384超节点支持的昇腾AI云服务因弹性灵活按需取用特性成为焦点[1] - 超节点首创将384颗昇腾NPU和192颗鲲鹏CPU通过MatrixLink全对等互联,形成算力达300 PFlops的超级AI服务器,突破跨机通信带宽瓶颈[3] - 昇腾AI云服务降低企业使用先进智算门槛,直接提供成熟软件栈和工具链,加速大模型研发与部署[3] CloudMatrix 384超节点技术特点 - 吞吐性能强:单卡Decoding吞吐达2300Tokens,软硬件协同优化[4] - 覆盖160+行业主流模型,高效支撑模型迁移[4] - 国内首创大规模专家并行方案,实现系统级优化,降低decode时延[4] - 初始投资小,每年迭代新版本,弹性按需使用[4] 行业应用案例 - 新浪"智慧小浪"推理效率提升50%以上,硅基流动每日服务600万用户推理[4] - 中科院自研AI4S科研大模型,面壁智能"小钢炮"模型推理性能大幅提升[4] - 360"超级搜索"纳米AI搜索采用该算力,讯飞大模型实现极致推理性能[4] 具身智能与垂直行业解决方案 - CloudRobo具身智能平台结合多模态生成大模型等能力,上海国地中心应用后数据采集成本降低90%[8] - 与北铁所合作铁路大模型及高铁智能巡检机器人,助力中国铝业打造有色金属行业首个大模型"坤安"[10] - "AI+气象"方案提升新能源发电效率,AI工业链赋能智能制造,钢铁热轧实现毫米级控制[10] 智能产品展示与未来规划 - 展区推出智能中医把脉仪、戴盟机器人、内置大模型的鸿蒙电脑等产品[10] - 公司将持续通过"尖刀技术"与垂直解决方案推动AI与产业深度结合[10]
封杀中国芯片?!歇斯底里,黔驴技穷!
半导体芯闻· 2025-05-21 18:29
美国对华为芯片的出口管制措施 - 美国商务部推出激进半导体出口管制措施,核心条款为全球任何国家或企业若使用华为昇腾910系列芯片,均被视为违反美国出口管制规定,最高面临20年监禁和100万美元罚款 [2] - 美国制造的芯片中国AI模型不能用,中国产的芯片其他地方的AI模型也不能用 [2] - 美国商务部公告指责华为昇腾芯片"很可能"使用了美国技术,属于"莫须有"的罪名 [9] 中国官方回应 - 商务部指出美方措施是典型的单边霸凌和保护主义做法,严重损害全球半导体产业链供应链稳定,剥夺其他国家发展先进计算芯片和人工智能等高科技产业的权利 [4] - 商务部强调任何组织和个人执行或协助执行美方措施,将涉嫌违反《中华人民共和国反外国制裁法》等法律法规,须承担相应法律责任 [4] - 外交部表示美方滥用出口管制和"长臂管辖",无端对中国芯片产品和人工智能产业进行恶意封锁和打压,中方对此坚决反对,绝不接受 [8] 华为昇腾芯片的技术优势 - 在一些测试中,华为昇腾芯片的效率比英伟达A100高出20% [11] - 华为云推出CloudMatrix 384超节点,基于昇腾云商用,规模、性能和可靠性全面超过英伟达NVL72 [11] 中美经贸关系的长期博弈 - 美国对华战略遏制逻辑未根本扭转,维护技术霸权、遏制中国发展的战略意图一以贯之 [9] - 中国立足14亿人的超大市场,推进"内循环",同时坚定开放,与欧盟、东盟等签下大量订单,签署中俄、中巴等联合声明 [10][11] - 分析认为美国此次全球封禁华为芯片是其"焦虑症"的再次发作,中国已为持久战做好准备 [11]
华为云黄瑾:六大科技创新,昇腾云定义下一代AI基础设施
经济网· 2025-05-19 16:17
华为云AI基础设施创新 - 华为云推出CloudMatrix 384超节点架构 具备六大技术优势:MoE亲和 以网强算 以存强算 长稳可靠 朝推夜训 即开即用 [1][3] - 超节点采用全对等互联架构 通过新型高速互联总线实现384张卡互联 最高提供300Pflops算力规模 比业界同类产品领先67% [3] - 当前大模型训练需求增长1万倍 但过去8年单卡算力仅增40倍 节点内总线带宽增9倍 跨节点网络带宽仅增4倍 集群网络通信成为最大挑战 [3] 技术架构突破 - 超节点集群已在芜湖 贵安 内蒙古规模上线 采用MoE亲和架构实现从小作坊到超级工厂的转变 [4] - 创新双层网络设计破解数据堵车问题 弹性内存改写算存绑定模式 具备故障自愈能力 [4] - 实现算力资源错峰用电和即开即用的普惠模式 提升资源利用率 [4] 行业应用与战略 - 华为云战略定位为昇腾云服务支持百模千态 盘古大模型重塑千行万业 [5] - 昇腾AI云服务已全面适配160多个大模型 包括DeepSeek等 以云服务方式协助客户进行模型开发训练托管和应用 [5] - 服务覆盖政府 金融 零售 互联网 交通 制造等行业600多家创新先锋企业 加速行业智能化应用落地 [5] - 公司致力于打造AI算力底座 提供安全稳定高质量的AI云服务 赋能行业数字化转型 [5]
华为云黄瑾:传统计算架构难支撑AI代际跃迁,超节点架构是创新
贝壳财经· 2025-05-16 20:56
华为云AI技术突破 - 公司推出CloudMatrix 384超节点架构,解决传统计算架构难以支撑AI技术代际跃迁的问题 [1] - 该架构通过新型高速互联总线实现384张卡互联,提供300Pflops算力规模,比英伟达NVL72提升67% [1] - 超节点架构具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势 [1] 算力需求与瓶颈 - AI算力需求在过去8年增长1万倍,但单卡硬件算力仅增长40倍,节点内总线带宽增长9倍,跨节点网络带宽仅增长4倍 [1] - 集群网络通信成为当前大模型训练和推理的最大挑战 [1] 技术优势与创新 - 超节点架构通过高速互联总线实现一卡一专家高效分布式推理,单卡MoE计算和通信效率大幅提升 [2] - MatrixLink服务具有两层网络,超节点内384张卡互联时延低至微秒 [2] - EMS弹性内存存储通过内存池化技术实现显存和算力解绑,首Token时延最高降低80% [2] - 昇腾云脑运维"1-3-10"标准将硬件故障感知率从40%提升至90% [2]
华为云黄瑾:传统计算架构已难以支撑AI技术代际跃迁,超节点架构开辟AI产业新路径
新浪科技· 2025-05-16 19:25
华为云AI峰会核心观点 - 华为云推出CloudMatrix 384超节点技术,通过全对等互联架构解决大模型训练和推理中的通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战 [1][2] - 该技术实现384张卡互联成为超级云服务器,提供300Pflops算力规模,比业界同类产品领先67% [2] - 超节点架构是系统性、工程性创新,重新定义新一代AI基础设施 [2] 技术演进与挑战 - 大模型训练从单卡、单机演进到AI集群训练,算力需求增长1万倍 [1] - 过去8年单卡算力增长40倍,但节点内总线带宽仅增长9倍,跨节点网络带宽仅增长4倍,集群网络通信成为最大挑战 [1] - 当前AI算力瓶颈已从单卡算力转移到集群间通信带宽 [1] CloudMatrix技术优势 - 具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势 [2] - 已在芜湖、贵安、内蒙规模上线 [2] - 采用新型高速互联总线技术 [2] 华为云AI战略 - 坚持"昇腾云服务支持百模千态,盘古大模型重塑千行万业"战略 [3] - 已全面适配DeepSeek等160多个大模型 [3] - 服务政府、金融、零售等600多家创新先锋企业 [3] - 通过昇腾AI云服务提供训练、推理性能升级,推动行业智能化应用落地 [3]