KUAE万卡智算集群
搜索文档
摩尔线程发布新一代GPU架构,打造MUSA生态对标英伟达CUDA
新浪财经· 2025-12-20 14:42
公司核心产品发布 - 摩尔线程在首届MUSA开发者大会上发布了新一代GPU架构“花港”、AI训推一体GPU“华山”、专业图形GPU“庐山”、智能SoC“长江”以及KUAE万卡智算集群 [2] - 基于“花港”架构的“华山”AI芯片,在浮点算力、访存带宽、访存容量、高速互联带宽方面已全面超越英伟达的Hopper系列芯片 [8] - 第五代“花港”架构计划于2026年量产,其算力密度将提升50%,能效提升10倍,并能支持十万卡以上规模的智算集群 [7] 产品性能对标与差距 - 与英伟达目前在美国市场主流的Blackwell系列芯片相比,“华山”芯片在访存容量上已实现超越,访存带宽处于同一水平,但在浮点算力和高速互联带宽方面仍有不小差距 [10] - 公司创始人张建中表示,在同数据量下,使用其新产品在DeepSeek-V3和R1等主流大模型训练的下游任务测评分数已经高于英伟达的Hopper芯片 [13] - 公司保持每年迭代一款GPU架构的节奏,从2022年到2025年已推出并量产四款架构 [7] 公司战略与行业定位 - 公司的经营模式、产品体系和发展方向一直对标英伟达,尤其在生态和基础算力设施构建、对物理AI的布局、高毛利率等方面 [5] - 公司正尝试超越英伟达,其“全功能GPU”理念旨在单颗芯片上集成AI计算、图形渲染和音视频解码等核心功能,更注重平衡性、性价比和便捷性 [5] - 公司高管团队中有不少成员来自英伟达中国,创始人张建中本人曾担任英伟达全球副总裁、大中华区总经理,于2020年9月离职 [5] 市场机遇与国产替代 - 当前正值AI算力需求爆发和国产化替代的关键窗口期,美国出口禁令为中国国产芯片创造了市场机会 [9] - 在中国本土市场,国内推理芯片已经大量取代外国产品,信创、智算中心的芯片国产化率大幅提升,但互联网数据中心尤其是大模型训练场景仍对英伟达H系列芯片依赖度较高 [13] - 公司新产品可能对英伟达芯片未来在华出货前景造成一定压力 [10] 开发者生态构建 - 举办MUSA开发者大会的核心目标之一是建立类似英伟达CUDA的、以MUSA架构为核心的开发者生态护城河 [13] - 中国工程院院士郑纬民指出,构建“主权AI”需要算力自主、算法自强和生态自立,其中生态问题尤为关键,需要让开发者愿意使用国产芯片 [14] - 公司宣布MUSA 5.0全面升级,能够支持包括国内、国外在内的所有生态,并呼吁开发者使用自有生态开发应用 [15] - 公司承认英伟达CUDA生态处于垄断地位,未来拓展业务将面临GPU芯片研发难度高及计算生态壁垒构建困难的挑战 [15]
能效提升10倍!摩尔线程最新发布
新浪财经· 2025-12-20 13:43
公司产品与技术路线 - 摩尔线程于2025年12月20日在北京举办首届MUSA开发者大会,这是国内首个聚焦全功能GPU的开发者盛会[1][10] - 公司计划于2026年发布新一代GPU架构“花港”,该架构具备新一代指令集,算力密度提升50%,能效提升10倍[1][3][10][12] - 基于“花港”架构,公司将发布两款芯片:新一代算力芯片“华山”和高性能图形渲染芯片“庐山”[5][6][14][15] - “华山”芯片支持AI训推一体、超智融合,支持构建超十万卡级AI工厂,其片间互联速度可达1314GB/s,并支持一个“超节点”部署1024个GPU[5][14] - “庐山”芯片的3A游戏性能将提升15倍[6][15] - 公司全功能GPU包含四大功能引擎:AI计算加速引擎、图形渲染引擎、物理仿真和科学计算引擎、超高清视频编解码引擎[3][12] - 公司的MUSA系统架构是支撑这些引擎的核心,类似于英伟达的CUDA,该架构已从2022年的“苏堤”迭代至2025年的“平湖”[3][12] - 公司发布KUAE万卡智算集群,其浮点运算能力达到10 Exa-FLOPS[8][17] 应用场景与生态建设 - 公司在开发者大会现场设置了近千平方米的展区,展示了国产GPU在AI大模型、Agent智能体、科学计算、空间智能、数字孪生、多媒体、6G试验网络等领域的最新应用[1][10] - 公司正将全功能GPU的应用拓展至量子科技、6G、具身智能、智能驾驶、智能农业等多个领域[8][17] - 具体合作包括:与玻色量子合作打造量子原生AI生成式模型;与中关村泛联院合作助力6G“通感算智”愿景[8][17] - 为培养开发者生态,公司成立了摩尔学院,截至12月用户量已接近20万[8][17] - 公司通过产教合作让大学生更早接触MUSA开发技能,并发布了面向个人开发者的AIBOOK笔记本,内置“长江”智能SoC芯片[8][17] 行业背景与战略定位 - 公司创始人张建中表示,人工智能基础设施离不开算力,公司旨在利用全功能GPU来建设该基础设施,以赋能“十五五”规划中的新兴产业和未来产业[3][12] - 集群化已成为AI大模型底层基础设施的普遍特征,正从千卡、万卡规模向十万卡规模持续进化[8][17] - 中国工程院院士郑纬民指出,实现“主权AI”需要算力自主、算法自强、生态自立三大支柱,其中生态自立尤为关键[9][18] - 当前国产芯片生态面临迁移成本高、工具链不成熟、文档社区支持不足等挑战,产业内存在接口标准不统一导致的碎片化问题[9][18] - 行业专家建议,应建立统一或高度兼容的接口标准,通过产业联盟推动联合优化,并在关键基础软件上形成共享的开放底座[9][18]