摩尔线程公布新GPU架构和万卡集群

公司核心产品与技术发布 - 摩尔线程召开首届MUSA开发者大会，公布新一代全功能GPU架构“花港”，支持FP4到FP64全精度计算，密度提升50%，效能提升10倍[1][7] - 基于“花港”架构推出两款芯片：AI训推一体芯片“华山”与专攻高性能图形渲染的芯片“庐山”[1][7] - 发布“夸娥”万卡智算集群，浮点运算能力达10 Exa-Flops，训练算力利用率在Dense大模型上达60%，在MOE大模型上达40%，有效训练时间占比超90%，训练线性扩展效率达95%[9] - 公司联合硅基流动在DeepSeek R1 671B全量模型上实现性能突破，MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s[12] - 公布面向下一代超大规模智算中心的MTT C256超节点架构规划，以及搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK[12] - 在图形计算领域，产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API，并与国产主流CPU及操作系统完成全栈适配，即将完整支持DirectX 12 Ultimate[15] - 自2022年1月以来，在3DMark Fire Strike测试中，MTT S80显卡成绩提升至3.4倍，并已追踪超过550款游戏，优化90款游戏体验[16] 公司战略与生态建设 - 公司自主研发MUSA（元计算统一计算架构），覆盖从芯片到软件的全栈技术体系[7] - 公司创始人指出，生态体系是GPU行业的核心护城河与价值所在，公司将依托MUSA架构加大研发投入，深化与生态伙伴协同，构建国产计算产业生态[23] - 公司在具身智能、科学智能、AI for 6G、硬件级光线追踪加速与自研AI生成式渲染技术等领域进行布局[12][14] 行业背景与专家观点 - 中国工程院院士郑纬民指出，发展“主权AI”是提升未来国家竞争力的关键，核心在于实现“算力自主、算法自强、生态自立”[2] - 专家认为，国产计算显卡与国外主流产品性能差距持续缩小，构建国产万卡乃至十万卡级别超大规模智算系统是必须完成的产业基础设施任务[2] - 专家强调，开发者是生态建设关键，国产芯片平台必须构建友好、易用的开发环境以服务开发者社群[2] - 从主权AI角度，国产万卡/十万卡系统是本土大模型与行业模型的“母机”与基座[5] 市场竞争格局 - 2024年中国智能计算芯片市场前两大参与者（英伟达、华为海思）合计占据94.4%市场份额，其余市场分散，无主要参与者份额超过1.0%[20] - 2024年中国GPGPU市场前两大参与者合计占有98.0%市场份额，市场共有不足10家规模化参与者[20] - 包括摩尔线程在内的几家已上市或拟上市GPU创业企业普遍处于亏损状态[19] 公司财务与市场表现 - 摩尔线程于2024年12月5日登陆科创板，市值一度突破4000亿元，目前回落至3100亿元左右[17] - 2024年1-9月，公司营收为7.85亿元，归属于母公司所有者的净利润为-7.24亿元[17] - 公司预计2025年归母净利润为-11.68亿元至-7.30亿元[17]