核心观点 - 摩尔线程在首届MUSA开发者大会上,系统性地发布了其新一代统一计算架构MUSA的全面升级路线图,标志着国产GPU在核心技术、产品性能及生态建设上取得了里程碑式突破,已具备承接超大规模AI训练与推理任务的能力 [3][5][45] 技术架构:MUSA与“花港” - 公司发布了自主研发的全栈技术体系MUSA(元计算统一系统架构),作为贯穿其所有产品的技术基石 [7] - 基于MUSA的新一代全功能GPU架构“花港”在处理器架构和指令集层面重新设计,相比上代,在同芯片面积下算力密度提升50%,能效提升10倍 [9] - “花港”架构支持从FP4到FP64的全精度端到端计算加速,并新增MTFP6/MTFP4及混合低精度支持 [9] - 新架构集成了AI生成式渲染架构(AGR),硬件光线追踪加速引擎性能比上一代提升50倍,并首次完整支持DirectX 12 Ultimate行业顶级图形标准 [10] - 自研MTLink互联技术实现高达1314GB/s的片间互联速度,支持十万卡以上规模的智能集群扩展 [9] - MUSA架构支持国际主流GPU生态、CPU系统以及所有国产主流CPU、操作系统和开发环境,并采用全硬件设计的安全保护机制 [9] 基础软件与生态 - 同步升级了MUSA 5.0软件栈,在AI框架上适配PyTorch、Paddle,并新增对Jax、TensorFlow的支持 [14] - 训练套件新增强化学习训练框架MT VeRL,推理套件新增对SGLang、VLLM、Ollama等推理框架的适配 [14] - 核心计算库在GEMM(通用矩阵乘法)上的效率超过98%,通讯效率达到97% [14] - 公司计划逐步开源一系列高性能算子库,并推出四大基础库:MTX(兼容跨GPU硬件指令架构)、muLang(全场景编程语言)、MUSA-Q(量子计算GPU融合框架)、muLitho(光刻计算加速库) [15][19] - 发起“摩尔学院”和“MUSA开发者计划”,已走进全国200多所高校,吸引超过10万名青年学子参与 [40] 新一代芯片产品 - 基于“花港”架构,公司公布了两款未来芯片路线图:“华山”面向AI计算,“庐山”面向专业图形渲染 [17][18] - AI计算芯片“华山”被定位为对标国际顶尖水平的训推一体芯片,其浮点计算能力处于NVIDIA Hopper与Blackwell芯片产品之间 [18] - “华山”集成了新一代张量计算单元(TCE),通过独特的TCE-PAIR模式提升计算效率,并内置大语言模型专用加速引擎 [21][22] - “华山”内置支持多种协议的MTLink 4.0,单节点支持1024卡高速互联,以满足万卡级集群需求 [23] - 图形渲染芯片“庐山”相比上一代S80显卡,3A游戏性能提升15倍,并引入了AI生成式渲染架构(AGR)和第二代硬件光线追踪引擎 [23][25] - “庐山”GPU据称具有目前全球最高的几何能力,可胜任3A游戏及CAD、CAE等专业应用场景 [25] 系统级产品与集群能力 - 公司正式发布夸娥万卡智算集群(KUAE2.0),拥有10 Exa-FLOPS算力,可支持万亿参数大模型训练 [31] - 该集群在Dense大模型上的训练算力利用率(MFU)超过60%,线性加速比达到95%,训练线性扩展效率达95% [31] - 计划推出超级节点产品MTT C256,能以一层scale up网络实现两柜256GPU全互联,提高智算中心GPU部署密度 [31] - 展示了搭载通用服务器的AI计算卡S5000的性能:可实现每秒1024 token的流畅解码,超过4000 token的峰值吞吐,能单卡跑满血DeepSeek大模型 [1][3] 前沿领域布局 - 公司布局的前沿计算场景包括具身智能、AI for Science(科学智能)、量子计算、AI for 6G等融合创新领域 [35][38] - 在具身智能领域,发布了MT Lambda仿真训练平台和基于“端云结合”的MT Robot解决方案 [38] - 在图形计算方面,推出全自研的AI生成式渲染技术MTAGR 1.0,推动渲染技术范式从“计算”走向“生成” [38] - MUSA生态已与合作伙伴在科学智能、量子科技等前沿交叉领域展开工作 [38] 终端产品与生态入口 - 发布了AI算力笔记本MTT AIBOOK,作为连接开发者与MUSA生态的核心入口 [42] - AIBOOK搭载自研智能SoC芯片“长江”,异构AI算力达50TOPS,可在本地运行30B参数的端侧大模型 [44] - AIBOOK支持Windows虚拟机、Linux、安卓容器及所有国产操作系统,实现了从芯片到开发环境的全栈整合,内置智能体“小麦”及多种AI应用 [44] - 该产品旨在降低AI开发门槛,为开发者、创作者及爱好者提供“开箱即用”的一站式AI开发体验 [42][44]
瞄准AI、图形顶端战场:摩尔线程上演国产GPU硬核实力路演
机器之心·2025-12-22 12:23