摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局

核心观点 - 摩尔线程在首届MUSA开发者大会上,系统展示了其在全功能GPU领域从架构创新、集群能力到生态建设的全面突破,标志着公司从单一场景加速卡产品向覆盖AI计算、图形渲染、科学计算等全场景的“全功能GPU”平台迈进 [1][5] - 国产高端算力发展正从单点芯片的“从无到有”,进入需要攻克超大规模系统工程、构建繁荣应用生态的“深水区” [11] 架构创新 - 新一代全功能GPU架构“花港”亮相,在计算密度上提升50%,效能提升最高达10倍,并完整支持从FP4到FP64的全精度计算 [3] - “花港”架构集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供了底层支持 [3] - 基于“花港”架构,公司规划两款芯片:专注于AI训练与推理一体化的“华山”,以及瞄准高性能图形渲染的“庐山” [5] - “庐山”芯片在图形性能上宣称实现数量级提升,AI计算、几何处理及光线追踪性能分别提升64倍、16倍和50倍 [5] 集群能力 - 首次系统披露了“夸娥”万卡智算集群的关键工程效率指标,成为国内少数公开万卡级实际训练效率的厂商之一 [6] - 该万卡集群在训练稠密大模型时,模型算力利用率达到60%,训练混合专家模型时模型算力利用率为40%,训练线性扩展效率达95%,有效训练时间占比超过90% [6] - 在推理侧,联合硅基流动在DeepSeek R1 671B全量模型上实现性能突破,经优化后,MTT S5000单卡在Prefill阶段吞吐量突破4000 tokens/s,Decode阶段突破1000 tokens/s [7] 生态建设 - 自主统一的软件架构MUSA已迭代至5.0版本,并计划逐步开源包括计算加速库、通信库及系统管理框架在内的核心组件 [8] - 发布了搭载自研“长江”智能SoC的AI算力本MTT AIBOOK,提供端侧50TOPS算力,旨在实现从芯片到开发环境的全栈整合与“开箱即用” [8] - 面向开发者的“摩尔学院”平台已汇聚近20万学习者,并通过校企合作覆盖全国超200所高校 [9] 技术融合与前沿探索 - 基于“花港”架构实现了硬件级光线追踪加速,并推出了自研的AI生成式渲染技术MTAGR 1.0 [10] - 已在具身智能、科学智能、AI for 6G等前沿交叉领域展开布局,发布了具身智能仿真训练平台MT Lambda及相应的机器人解决方案 [10]

摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局 - Reportify