AI计算生态
搜索文档
摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达
凤凰网· 2025-12-21 14:18
核心观点 - 摩尔线程在北京首届MUSA开发者大会上,系统展示了其从芯片架构、集群基础设施到端侧设备的全栈技术布局,旨在为国内AI计算生态提供硬件与软件支持[1][2] - 行业人士普遍认为,公司正全面对标英伟达,通过提前发布新一代GPU架构“花港”以提升软件生态信心[2] 新一代GPU架构“花港” - 公司公布了新一代全功能GPU架构“花港”,支持从FP4到FP64的全精度计算[1] - 新架构算力密度提升50%,能效实现10倍提升[1] - 基于“花港”架构,公司计划推出专注于AI训练与推理的“华山”芯片,以及面向图形渲染的“庐山”芯片[1] - 新架构集成了硬件光线追踪加速引擎,并支持自研的AI生成式渲染技术[2] AI训练与推理能力 - 公司推出“夸娥”万卡智算集群,具备全精度通用计算能力[1] - 该集群在稠密模型上的训练算力利用率达到60%,在混合专家模型上达到40%[1] - 训练线性扩展效率为95%[1] - 在推理侧,公司与硅基流动合作,在DeepSeek R1671B模型上实现单卡Prefill吞吐量超过4000 tokens/s,Decode吞吐量超过1000 tokens/s[1] 软件生态与开源计划 - 公司发布了MUSA 5.0版本,对编程模型、计算库和编译器进行了优化[1] - 核心计算库muDNN的GEMM与FlashAttention效率超过98%,通信效率达97%[1] - 公司计划逐步开源部分核心组件,包括计算加速库与系统管理框架[1] 前沿领域布局与产品 - 公司展示了在具身智能、AI for Science等前沿领域的布局[2] - 推出了仿真训练平台MTLambda以及基于“长江”SoC的AI算力本MTT AIBOOK[2] 超大规模智算中心架构 - 公司公布了面向下一代超大规模智算中心的MTTC256超节点架构设计,着眼于高密度硬件与能效优化[2]