CloudMatrix384超节点
搜索文档
超节点持续演进,看好国产算力 | 投研报告
中国能源网· 2025-11-12 10:53
市场表现回顾 - 过去一周(11月03日至11月07日)上证综指上涨1.08%,创业板指上涨0.65%,沪深300指数上涨0.82% [1][2] - 同期计算机(申万)行业指数下跌2.54%,表现显著弱于大盘,跑输上证综指3.62个百分点,跑输创业板指3.19个百分点,跑输沪深300指数3.36个百分点 [1][2] - 计算机行业指数在全部行业中排名第30位 [1][2] 超节点技术趋势 - 超节点(Superpod)是一种用于构建大规模算力集群的技术架构,旨在通过高速互联技术优化算力效率 [3] - 英伟达NVLINK技术已迭代至第五代,每块Blackwell GPU拥有18个NVLink连接,总带宽达到1800GB/s,远超PCIe Gen6总线带宽 [3] - 英伟达发布的NVL72系统可将36个Grace CPU和72个Blackwell GPU集成于一个液冷机柜,实现720 PFLOPs的AI训练性能或1440 PFLOPs的推理性能 [3] 国内厂商超节点布局 - 中科曙光发布全球首个单机柜级640卡超节点scaleX640,采用“一拖二”高密架构,单机柜算力密度提升达20倍,双节点可组成千卡级计算单元,支持10万卡级超大规模集群扩展 [4] - 华为CloudMatrix384超节点已销售300余套,服务20余家客户,主要需求来自政企,其可将432个超节点级联成最高16万卡的超大集群 [4] - 阿里云发布磐久128超节点AI服务器,集成自研CIPU2.0芯片和高性能网卡,单柜支持128个AI计算芯片,同等算力下推理性能较传统架构提升50% [4][5] - 百度在2025百度云智大会上宣布昆仑芯超节点上线 [5] - 沐曦股份已发布多种超节点形态,包括光互连超节点、耀龙3D Mesh超节点等 [5] - 中兴通讯自研超节点服务器单机柜搭载64个GPU,机柜内GPU间正交互联,时延降至百纳秒级,可支撑万卡、十万卡级超大规模智算集群 [5] - 浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200” [5] 投资建议关注领域 - 算力领域建议关注寒武纪、海光信息、中科曙光、华丰科技、申菱环境、英维克、欧陆通、中恒电气等公司 [6] - AIDC(AI数据中心)领域建议关注科华数据、云赛智联、弘信电子、润建股份、润泽科技、数据港等公司 [6] - AI应用领域建议关注金山办公、科大讯飞、福昕软件、万兴科技、鼎捷数智、汉得信息、能科科技、卓易信息等公司 [6]
创新驱动,中外企业家探讨共赢新模式
环球网· 2025-11-06 08:33
会议核心观点 - 会议主题为重塑增长引擎,强调以创新驱动提升全球竞争力,企业需以高质量发展对冲外部不确定性 [1] - 数字化、智能化和低碳化是当前世界三个确定性的发展方向 [5] - 在复杂国际环境下,维护供应链安全稳定成为企业关注焦点,开放合作的供应链才能带来共赢 [8] 企业创新战略与研发投入 - 国务院国资委支持中央企业持续优化科技创新机制、健全激励约束体系,营造开放包容的创新生态 [1] - 华为每年研发费用占公司收入20%,持续投入使其发布整体计算性能超越英伟达的CloudMatrix384超节点AI服务器 [5] - 创新被视作依存于开放合作的生态系统,实现全球视野与本地化深耕的融合是关键 [6] 能源转型与可持续发展 - 中国华能将ESG理念融入公司发展,加快实施非化石能源替代行动,加强绿色低碳技术创新 [4] - 电网现代化改造尤其是特高压电网对实现绿色电力规模化稳定供应至关重要,需推动绿色电力证书跨境互认 [4] - 西门子能源指出技术与创新是加速全球能源转型的核心驱动力,需扩大智能电网规模并提升行业能效 [5] - 沙特阿美强调联合创新是共同创造未来,成功要素包括政府清晰规划、伙伴优势互补及聚焦产业化 [7] 国际合作与供应链重构 - 中国化学工程以管理创新应对市场准入,以科技创新应对技术标准,成功将中国技术标准推广至一带一路国家 [6] - 法国电力集团与中国伙伴优势互补,在氢能、储能、数字孪生等前沿低碳技术领域合作,并建议建立区域供应链协作网络 [7] - 全球供应链深度调整中,脱离中国的供应链不经济,中外企业可在第三方国家开展互利合作 [8] 数字化与人工智能发展 - 世界经济论坛指出需把握人工智能革命与数字经济的巨大潜能,推进绿色与数字的双重转型 [2] - 华为发布的AI服务器将384颗昇腾NPU和192颗鲲鹏CPU全对等互联,形成超级计算性能 [5]
国产阵营加码超节点:华为阿里领跑,AI算力走向系统级效率
贝壳财经· 2025-10-11 15:53
超节点成为AI算力新形态 - AI算力需求从单点突破走向系统级整合,超节点正成为突破传统算力瓶颈的新型主导性产品形态和AI基础设施建设的新常态 [1] - 国内科技巨头华为推出CloudMatrix384超节点,集成384颗昇腾NPU和192颗鲲鹏CPU,单卡推理吞吐量达2300 Tokens/s [1] - 阿里云发布磐久128超节点AI服务器,集成自研CIPU 2.0芯片和高性能网卡,单柜支持128个AI计算芯片 [1] 超节点的技术定义与挑战 - 超节点是由AI计算节点通过高速互联协议组成、具备更大内存空间的AI系统,需支持32及以上AI芯片,芯片到交换芯片带宽不小于400GB/s,交换设备时延小于500ns [2] - AI算力建设面临通信墙、功耗散热墙、复杂度墙三大挑战,千亿级模型一次梯度同步产生TB级数据使传统以太网带宽难以承受 [2] - 超节点通过Scale Up组网突破单机算力边界,通过Scale Out组网实现集群化扩展,这两大能力决定AI模型训练与推理的效率 [2] 华为超节点进展与规划 - 华为Atlas 900超节点自今年3月上市已累计部署超300套,服务20多个客户 [3] - 华为Atlas 950超节点将于2026年第四季度上市,相比英伟达NVL144,其卡规模是56.8倍,总算力是6.7倍,内存容量达1152TB是其15倍,互联带宽达16.3PB/s是其62倍 [3] - 华为云将开放灵衢2.0互联协议技术规范,并推出全球首个通用计算超节点TaiShan 950超节点 [3] 阿里巴巴及其他厂商布局 - 阿里巴巴强调超级AI云是下一代计算机,需要更稠密算力、更高效网络、更大集群规模 [4] - 阿里磐久128超节点可实现Pb/s级Scale-Up带宽和百ns极低延迟,同等AI算力下推理性能提升50% [4] - 阿里巴巴推进三年3800亿的AI基础设施建设计划并持续追加投入 [4] - 中科曙光发布国内首个基于AI计算开放架构的AI超集群系统,浪潮信息发布超节点AI服务器"元脑SD200",沐曦股份发布多种超节点形态 [4] 全球AI基建加速发展 - OpenAI与AMD达成战略合作,将部署6吉瓦AMD GPU算力,首批1吉瓦AMD Instinct MI450 GPU部署预计2026年下半年启动 [7] - OpenAI与英伟达计划部署至少10吉瓦英伟达系统,英伟达计划对OpenAI投资高达1000亿美元 [7] - OpenAI与甲骨文签署为期五年、总价值高达3000亿美元的算力合作协议 [7] - 英伟达预计到2030年人工智能基础设施支出将达到3万亿至4万亿美元 [9] 行业影响与趋势 - 中美AI竞争从单卡性能走向系统级效率,中国正通过集群建设+开源生态+工程化交付方式实现AI基建弯道超车 [1] - 超节点总线级互联与平等协同机制使万卡集群在逻辑上作为一台统一计算机运行,实现计算与内存资源全局调度 [5] - 超节点驱动智算中心向高密度、高效率、高弹性、大规模的四高特征变革 [6] - 全球科技巨头持续加大AI算力基础设施投入,将驱动模型能力迭代和多个领域AI应用商业化加速 [10]
华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布
搜狐财经· 2025-09-28 17:48
AI CITY战略与架构 - AI CITY是以"模型+知识"智能驱动的新型智慧城市范式,区别于传统数据智能驱动的智慧城市[5] - 公司提出"1234MNX"参考架构:1个智能云底座、2大保障体系、3套AI工程平台、4类运营、M类数据与N类模型资产、X个创新应用[6] - 该架构旨在解决政务端数据孤岛与AI场景适配不足、产业端普惠算力与行业模型缺失、科研端资源碎片化等核心痛点[5] 技术能力与产品进展 - 华为云发布CloudMatrix384超节点和新一代昇腾AI云服务,为大模型应用提供强劲算力[8] - 盘古大模型5.5正式发布,自然语言处理、计算机视觉、多模态、预测、科学计算五大基础模型全面升级[8] - 公司布局"根技术"包括鲲鹏、昇腾、高斯数据库等,打造开放共享的算力系统及自主创新软件生态[12] 落地应用案例与成效 - 深圳市政务场景:70名AI数智员工覆盖240个场景,日均服务超15万次[6] - 广州白云区城市治理:构建"1+4+N"智慧城管体系,数据查询及政策问答响应时间缩短至10秒[6][11] - 广州花都区产业赋能:企业研发周期从数月缩至数天,产品设计效率提升50%[6] - 东莞制造企业:人工智能大模型中心帮助产线检测准确率提升至99%[6] 生态建设与人才培养 - 华为云向城市共享全球生态能力,带动优秀企业融入城市AI生态[12] - 开放华为云学堂2000+在线课程,累计培训高校学生14.7万人,开发者超过200万人[12] - 发起AI CITY产业联合创新计划,邀请各方伙伴共同丰富模型应用场景[7] 行业趋势与未来展望 - 人工智能应用场景和价值正从量变走向质变,AI推理能力爆发重塑全球城市治理与发展范式[3] - 未来城市所有决策都可被计算,所有应用都可模型化,所有对象都可以连接[8] - 人工智能推动城市生产方式、生活方式和治理方式全面变革,是实现人工智能整体性、系统性跃升的重要载体[11]
HC2025 AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布
搜狐财经· 2025-09-23 01:35
AI CITY战略与架构 - 公司提出AI CITY是以“模型+知识”智能驱动的新型智慧城市,区别于传统数据智能驱动的模式,代表城市治理体系和能力的跃迁 [5] - 公司联合国家信息中心发布AI CITY“1234MNX”参考架构,包括1个智能云底座、2大保障体系、3套AI工程平台、4类运营、M类数据与N类模型资产、X个创新应用 [5][6] - 该架构旨在解决政务端数据孤岛与AI场景适配不足、产业端普惠算力与行业模型缺失、科研端资源碎片化等核心痛点 [5] 技术底座与产品进展 - 公司发布CloudMatrix384超节点并为新一代昇腾AI云服务提供算力,同时发布盘古大模型5.5,其自然语言处理、计算机视觉、多模态、预测、科学计算五大基础模型全面升级 [8] - 公司提出人工智能驱动城市发展的五大优势:新智能终端、新算力基础设施、新数据基础设施、新AI大模型、新生态企业 [9] - 公司基于鲲鹏、昇腾、高斯数据库等“根技术”打造开放算力系统与软件生态,并向城市共享全球生态能力与人才培养服务 [12] 落地应用案例与成效 - 在政务服务领域,公司与深圳市合作推动深小i升级,70名AI数智员工覆盖240个场景,日均服务超15万次 [6] - 在城市治理领域,广州白云区构建“1+4+N”智慧城管体系,基于盘古NLP大模型的城管数字人将数据查询及政策问答响应时间缩短至10秒 [6][11] - 在产业赋能领域,广州花都区新型工业化平台助力企业研发周期从数月缩短至数天,产品设计效率提升50%;东莞人工智能大模型中心帮助制造企业将产线检测准确率提升至99% [6] 生态合作与未来发展 - 公司倡议携手科研院所和政企客户创新先锋案例,邀请伙伴加入AI CITY产业联合创新计划,并加强AI人才培养 [7] - 公司通过华为云学堂提供2000+在线课程,已累计培训高校学生14.7万人,开发者超过200万人 [12] - 公司展望未来城市所有决策可被计算、所有应用可模型化、所有对象可连接,致力于为世界构建第二甚至更优选择 [8]
华为云再掀算力风暴:CloudMatrix384超节点将升级,Tokens服务性能最大可超H20四倍
量子位· 2025-09-19 12:11
华为云算力黑土地理念与战略 - 华为云提出"算力黑土地"理念,旨在为企业和开发者提供肥沃的AI创新基础,通过框架创新和软硬协同等能力积累使这片"土壤"越来越肥沃 [7] - 公司策略是智算与通算协同推进,以覆盖全产业算力需求 [8][9] - 智算聚焦AI前沿,提供极致性能与弹性服务;通算依托鲲鹏云服务,提供安全可信的云上通用算力 [12] CloudMatrix超节点技术突破与演进 - CloudMatrix384超节点在2025年4月发布并商用,并于同年6月基于其的新一代昇腾AI云服务全面上线 [6] - 基于最新AI服务器规划,CloudMatrix超节点规格将从384卡升级到未来的8192卡,依托MatrixLink高速对等互联网络实现百万卡AI集群 [5][19] - 超节点通过自研MatrixLink网络将384颗昇腾NPU和192颗鲲鹏CPU紧密耦合,形成逻辑统一的超级"AI服务器",通过Scale Out方式可组成超16万卡的AI集群 [18] Tokens服务模式创新与优势 - 华为云推出基于CloudMatrix384超节点的Tokens服务,这是一种面向AI大模型推理场景、按实际Token消耗量计费的云服务模式 [14] - 数据显示,中国日均Token消耗量从2024年初的1000亿增长至2025年6月底的30万亿,一年半时间增长300多倍 [15] - Tokens服务能有效屏蔽复杂的底层技术实现,用户可直接获得"AI的最终结果",其性能宣称超越英伟达H20达3-4倍 [17] 关键技术创新细节 - 首创EMS弹性内存存储服务,将NPU显存、CPU内存和存储资源解耦,形成统一资源池,实现显存独立扩容,多轮对话Token时延大幅降低 [5][19] - 实现PDC分离及动态PD,将Prefill、Decode固化在各自集群,并设立独立的KV缓存集群,提高负载均衡和NPU利用率 [20] - 超节点专为主流MoE架构设计,支持"一卡一专家"的分布式推理模式,如256个专家对应256张卡,减少通信延迟和显存占用 [20] 行业应用案例与性能提升 - 为360纳米AI平台提供算力支持,该平台单任务执行步骤可达1000步,消耗500万至3000万Tokens,华为云将其调用量最大的模型部署在CloudMatrix384上进行全面调优 [21][22] - 为中国科学院自动化研究所的"磐石·科学基础大模型"提供基于国产化昇腾芯片的昇腾AI云服务,实现全链路自主可控 [23][25] - 在北京正负电子对撞机的粒子轨迹重建任务中,基于磐石大模型和华为云服务,模拟速度提升1个量级,物理分析周期缩短1个量级 [25] 鲲鹏通算业务进展 - 鲲鹏云业务基于自研鲲鹏处理器,提供面向通用计算场景的云服务 [11] - 云上鲲鹏核数从900多万核增长到1500万核,增幅达到67%,已适配超过25000个应用,为ARM生态繁荣提供支撑 [11] 全球算力竞争背景 - AI行业普遍存在算力焦虑,硅谷大厂如OpenAI、马斯克旗下公司、Meta、AWS等均在积极获取更多算力资源 [3] - 算力发展需要单点技术突破以及芯片、硬件、架构、软件、网络、能源乃至整个产业生态的协同演进 [3]
首个适配384超节点的混合云将于10月30日商用
证券时报网· 2025-09-18 23:14
产品发布 - 华为云Stack8 6新版本将于10月30日正式商用 [1] - 新版本适配CloudMatrix384超节点 [1] 行业地位 - 该产品是业界首个支持CloudMatrix384超节点的混合云 [1]
华为云Stack8.6发布 正式适配384超节点
证券时报网· 2025-09-18 22:50
产品发布 - 华为云Stack8 6版本在华为全联接大会2025期间正式发布 [1] - 华为混合云总裁肖霏为产品发布人 [1] 技术适配 - 华为云Stack8 6已正式适配CloudMatrix384超节点 [1] 客户基础 - 全球超过5500家政府和企业客户选择华为云Stack开展云上创新 [1]
华为全连接大会召开在即,被曝将发布昇腾场景化一体机
选股宝· 2025-09-04 07:31
华为全连接大会2025 - 大会将于9月18日-20日召开 主题为"跃升行业智能化" 通过战略全景-产业技术-生态发展三维视角阐释全面智能化战略 [1] - 将发布全新数智基础设施产品 行业场景化解决方案 开发工具 [1] 昇腾AI产品发布 - 9月18日14:30-15:00举办昇腾AI人工智能产业峰会 发布昇腾场景化一体机 [1] - 华为云4月发布CloudMatrix384超节点 集成384颗昇腾NPU和192颗鲲鹏CPU 通过MatrixLink全对等互联 [1] - 算力规模达300PFlops 新一代昇腾AI云服务已于6月全面上线 为大模型应用提供算力支持 [1] 华为芯片业务战略 - 芯片与器件业务是华为技术自主的核心 虽面临制程瓶颈 但通过架构创新 产业链协同及生态开放持续支撑终端 汽车 云等业务 [1] - 昇腾AI芯片产业链充分受益于国内AI算力基础设施建设浪潮 [1] 昇腾一体机合作伙伴 - 先进数通作为华为钻石经销商 代理销售华为昇腾一体机 [2] - 软通动力联合某大型通讯设备企业推出AI机器人-昇腾一体机 [3]
华为云CEO:384超节点每卡性能可达英伟达H20三倍
观察者网· 2025-08-30 11:38
公司战略与定位 - 华为云强调以提供客户所需计算结果为核心目标 而非单纯依赖芯片工艺[1] - 公司通过系统级创新弥补单点短板 包括以空间换算力 以带宽换算力 以能源换算力[1] - 组织架构调整为聚焦3+2+1业务:通算 智算 存储三大基础服务 AI PaaS与数据库两大平台 安全业务一个核心[6] - 调整目的为集中资源最大化"昇腾AI+盘古"组合优势 砍掉协同效应弱的外围研发[6] 技术突破与产品进展 - 发布CloudMatrix384超节点 集成384颗昇腾NPU和192颗鲲鹏CPU 算力达300 PFlops[2] - 通过xDeepServe架构实现单芯片2400TPS吞吐量与50msTPOT时延 超越业界水平[2][3] - xDeepServe采用Transformerless分离架构 将MoE大模型拆分为Attention/FFN/Exper微模块并行处理[3] - 超节点单卡吞吐量从600tokens/s提升至2400tokens/s 达H20芯片效率的三倍[3] - 支持横向扩展至16万卡AI集群 可同时训练1300个千亿参数大模型[2] 市场表现与客户增长 - 昇腾AI云服务客户数从321家增长至1714家 同比增长434%[5] - 整体算力规模同比增长接近250%[5] - 在中国大陆云服务市场占据18%份额 位列第二[6] - 智能驾驶领域取得突破 引望(中国最大智驾企业)已部署于昇腾平台[6] - CloudMatrix384在感知模型/E2E/VLA模型测试中达到H100的2.5-3倍性能[6] 基础设施布局 - 围绕贵安 乌兰察布 和林格尔 芜湖打造全国算力一张网[5] - 仅在贵州已部署超40套CloudMatrix384超节点[5] - 华为云贵安汽车专区正式上线 长安天枢智驾搭载CloudMatrix384亮相[5] - 云服务连续756天保持重大事故为零记录[5] 行业趋势与认知 - 未来十年算力需求可能有数万倍增长[1] - 市场主流需求从"上云"转向"上AI" AI工作负载成为云业务核心引擎[6] - 需以AI原生思维重构应用 数据 流程和人员组织[7] - 中国拥有千行万业业务场景 有望在各行业构筑全球AI领先优势[7]