Workflow
AI算力本MTT AIBOOK
icon
搜索文档
摩尔线程发布多项关键技术成果 董事长张建中:生态体系是GPU行业核心护城河
搜狐财经· 2025-12-20 14:05
央广网北京12月20日消息(记者 齐智颖)摩尔线程在首届MUSA开发者大会(MDC 2025)上发布了以自主MUSA统一架构为核心的全栈技术成果,全面展 示了公司在高端全功能GPU领域的关键突破与前瞻布局。 海淀区委书记、中关村科学城党工委书记张革在大会开场致辞中指出:"海淀区作为北京国际科技创新中心的核心区,以'国家所需'为导向,坚持走新时代 科技创新之路,始终把培育硬科技企业摆在重要位置。我们将聚焦'打造自主创新策源地和新兴产业集聚地'的目标,携手摩尔线程和各位开发者,共筑全国 GPU最优生态。" 中国工程院院士、清华大学计算机系教授郑纬民在发表主题演讲时指出,高端AI芯片从全球化分工时代发展到"主权AI"时代,发展"主权AI"是提升未来国家 竞争力的关键,其核心在于实现"算力自主、算法自强、生态自立"的完整体系。 本次大会上,摩尔线程集中发布了一系列技术与产品进展。该公司发布全功能GPU架构"花港","夸娥"万卡智算集群。据介绍,"花港"支持FP4到FP64的全 精度计算,密度提升50%,效能提升10倍。摩尔线程表示,未来将基于该架构推出高性能AI训推一体"华山"芯片与专攻高性能图形渲染的"庐山"芯片。 ...
摩尔线程发布新一代GPU架构「花港」:国产GPU实现万卡训练与推理双突破
IPO早知道· 2025-12-20 14:02
核心观点 - 摩尔线程在MDC 2025大会上系统展示了以自主MUSA统一架构为核心的全栈技术成果,标志着公司已成功构建起一套贯穿“芯-边-端-云”的完整技术栈,为国产智能计算生态提供了平台级支撑 [3][10] 新架构“花港”发布 - 发布新一代全功能GPU架构“花港”,支持FP4到FP64的全精度计算,算力密度提升50%,效能提升10倍 [6][11] - 架构核心特性包括:基于新一代指令集实现算力密度提升50%与能效优化;支持FP4至FP64全精度计算,新增MTFP6/MTFP4及混合低精度支持 [11] - 集成新一代异步编程模型,并通过自研MTLink高速互联技术支持十万卡以上规模智算集群扩展 [11] - 内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形与AI深度融合 [11] - 架构基于全栈自主研发,截至2025年6月30日,公司累计授权专利514项(其中发明专利468项),并通过四层硬件安全架构提供可验证安全守护 [11] 基于新架构的未来芯片路线 - 基于“花港”架构,未来将推出两款芯片:“华山”芯片专注AI训推一体与超大规模智能计算,支持FP4至FP64全精度计算,为万卡级智算集群提供算力支撑 [6][12][14] - 另一款“庐山”芯片专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染与全新硬件光追引擎 [6][16] 智算集群与推理性能突破 - 发布“夸娥万卡”智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平 [7] - 公司联合硅基流动,在DeepSeek R1 671B全量模型上实现推理性能突破,MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆 [7] 超节点架构与个人智算平台 - 分享了面向下一代超大规模智算中心的MTT C256超节点架构,着眼高密硬件架构以实现极致智算性能 [8] - 正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,赋能“摩尔学院”20万开发者与学习者 [9] 图形与前沿技术布局 - 揭晓硬件级光线追踪加速与自研AI生成式渲染技术,并在具身智能、科学智能(AI4S)、AI for 6G等前沿领域进行深度布局,印证了全功能GPU技术路线的广度与可扩展性 [10]