Workflow
花港GPU架构
icon
搜索文档
摩尔线程发布新一代GPU架构「花港」:国产GPU实现万卡训练与推理双突破
IPO早知道· 2025-12-20 14:02
核心观点 - 摩尔线程在MDC 2025大会上系统展示了以自主MUSA统一架构为核心的全栈技术成果,标志着公司已成功构建起一套贯穿“芯-边-端-云”的完整技术栈,为国产智能计算生态提供了平台级支撑 [3][10] 新架构“花港”发布 - 发布新一代全功能GPU架构“花港”,支持FP4到FP64的全精度计算,算力密度提升50%,效能提升10倍 [6][11] - 架构核心特性包括:基于新一代指令集实现算力密度提升50%与能效优化;支持FP4至FP64全精度计算,新增MTFP6/MTFP4及混合低精度支持 [11] - 集成新一代异步编程模型,并通过自研MTLink高速互联技术支持十万卡以上规模智算集群扩展 [11] - 内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形与AI深度融合 [11] - 架构基于全栈自主研发,截至2025年6月30日,公司累计授权专利514项(其中发明专利468项),并通过四层硬件安全架构提供可验证安全守护 [11] 基于新架构的未来芯片路线 - 基于“花港”架构,未来将推出两款芯片:“华山”芯片专注AI训推一体与超大规模智能计算,支持FP4至FP64全精度计算,为万卡级智算集群提供算力支撑 [6][12][14] - 另一款“庐山”芯片专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染与全新硬件光追引擎 [6][16] 智算集群与推理性能突破 - 发布“夸娥万卡”智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平 [7] - 公司联合硅基流动,在DeepSeek R1 671B全量模型上实现推理性能突破,MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆 [7] 超节点架构与个人智算平台 - 分享了面向下一代超大规模智算中心的MTT C256超节点架构,着眼高密硬件架构以实现极致智算性能 [8] - 正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,赋能“摩尔学院”20万开发者与学习者 [9] 图形与前沿技术布局 - 揭晓硬件级光线追踪加速与自研AI生成式渲染技术,并在具身智能、科学智能(AI4S)、AI for 6G等前沿领域进行深度布局,印证了全功能GPU技术路线的广度与可扩展性 [10]
摩尔线程发布新一代GPU架构,能效提升10倍
证券时报网· 2025-12-20 12:05
公司产品发布 - 摩尔线程于12月20日在其首届MUSA开发者大会上发布了新一代GPU架构“花港” [1] - 新一代架构“花港”基于新一代指令集,其算力密度提升50% [1] - 新一代架构“花港”的能效提升10倍,并可支持十万卡以上规模的智算集群 [1]
摩尔线程发布“庐山”GPU芯片,AI性能提升64倍
新浪财经· 2025-12-20 11:10
新浪科技讯 12月20日上午消息,今日举办的摩尔线程2025MUSA开发者大会上,摩尔线程创始人、董 事长兼首席执行官张建中宣布,基于摩尔线程最新一代GPU架构"花港"的系列芯片——华山、庐山,将 于明年量产上市。 据张建中介绍,"花港"将采用全新一代的指令集,支持异步编程模型和高效的线程同比;同时,算力密 度将提升50%,能效提升10倍。此外,"花港"还支持支持十万卡以上规模智算集群,为了强强算力利用 率,该芯片还发明了新一代的异步编程模型。 基于花港架构的"庐山"高性能图形渲染芯片,将实现3A游戏渲染15倍的提升,AI性能提升64倍,光线 追踪性能提升50倍。除支持游戏体验外,还支持所有CAD、CAE等图形设计渲染。 此外,基于该架构的GPU芯片"华山",在浮点算力、访存带宽、访存容量和高速互联带宽方面,取得了 多项领先甚至超越国际主流芯片的能力。(文猛) 责任编辑:宋雅芳 新浪科技讯 12月20日上午消息,今日举办的摩尔线程2025MUSA开发者大会上,摩尔线程创始人、董 事长兼首席执行官张建中宣布,基于摩尔线程最新一代GPU架构"花港"的系列芯片——华山、庐山,将 于明年量产上市。 据张建中介绍,"花 ...
摩尔线程新GPU架构可支持十万卡规模集群
第一财经· 2025-12-20 10:45
公司产品发布 - 摩尔线程于12月20日发布新一代GPU架构“花港” [1] - 新架构采用新一代指令集 [1] - 新架构的算力密度提升50% [1] - 新架构的能效提升10倍 [1] - 新架构可支持十万卡以上规模的智算集群 [1]