Workflow
主权AI
icon
搜索文档
从“能用”到“好用”!中国工程院院士郑纬民详解“主权AI”三大支柱 直指国产算力核心痛点
每日经济新闻· 2025-12-20 22:20
12月20日,摩尔线程首届MUSA开发者大会(MDC 2025)在北京中关村国际创新中心开幕。 在主论坛环节,中国工程院院士、清华大学计算机系教授郑纬民提出,在芯片产业全球化分工遭遇技术封锁的背景下,构建中国"主权AI"计算引擎成为紧迫 任务。要实现"主权AI",需从算力自主、算法自强、生态自立三方面入手。 从"主权AI"基建的角度出发,发展国产万卡/十万卡系统是不得不走的一步,但仍需解决互联网络与拓扑、可靠性与运维、能耗与供电散热等方面的问题。 至于国产芯片厂商都要面对的终极问题——生态建设,在郑纬民看来,真正决定"主权AI"生态成败的,是有没有足够多的开发者愿意长期在这套栈上写代 码。未来国产平台要提高用户的开发体验,还需解决迁移成本高、工具链不成熟、文档/社区与支持不足等问题。 郑纬民教授现场演讲,图片来源:每经记者杨卉摄 "主权AI"三大支柱:算力自主、算法自强、生态自立 过去很长一段时间,芯片产业一直处于全球化分工的状态,架构设计、制造装备、代工、封测等环节均涉及不同领域。然而,近年来高端AI芯片面临出口 管制、技术封锁等困境,算力从一般生产要素上升为战略资源,"主权AI"也从学术讨论逐步变为每个国 ...
加速构建国产计算产业生态,多项国产GPU技术成果发布
北京日报客户端· 2025-12-20 21:43
除主论坛外,大会还设置了20余场技术分论坛与超过1000平方米的"MUSA嘉年华"沉浸式展区,全面呈 现了国产GPU在AI大模型、科学智能、数字孪生、工业仿真、数字文娱、智慧医疗等前沿与产业场景 中的应用潜力。 海淀区委书记、中关村科学城党工委书记张革说,摩尔线程自2020年成立以来扎根海淀,专注于全功能 GPU自主研发,以"一年一芯片"的迭代速度推出四代产品,在AI智算、数字孪生等领域填补了国内技术 空白,是海淀区硬科技企业创新发展的典型代表。本次大会不仅是企业技术成果的集中展示,也是海淀 区人工智能与集成电路产业生态协同共进、向优发展的生动体现。 12月20日,首届摩尔线程MUSA开发者大会在中关村国际创新中心举办。大会上,不久前刚成功登陆资 本市场的海淀全功能国产GPU企业摩尔线程集中发布了一系列技术与产品新成果,如计算提升50%、效 能提升10倍的全功能GPU架构"花港",在多项关键精度指标上达到国际主流水平的夸娥万卡智算集群 等,推动国产GPU技术与生态实现进一步突破。 中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲时指出,发展"主权AI"是提升未来国家竞 争力的关键,其核心在于实现"算力自 ...
周末重磅!摩尔线程 首次公开
上海证券报· 2025-12-20 21:24
核心观点 - 摩尔线程在首届MUSA开发者大会上,首次公开了其全功能GPU技术路线图,并发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本等一系列技术与产品进展,标志着公司已构建起贯穿“芯-边-端-云”的完整自主技术栈,并致力于加速构建国产计算产业生态 [2][3][11] 新一代GPU架构与芯片路线图 - 公司宣布其自主研发的元计算统一架构MUSA升级至5.0版本,在全栈统一性、效能与生态开放性上取得关键突破 [3] - 基于MUSA发布了新一代GPU架构“花港”,基于新一代指令集,支持FP4到FP64的全精度计算,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [3] - 基于“花港”架构,公布了未来两款芯片技术路线:“华山”专注AI训推一体与超大规模智能计算,支持从FP4至FP64的全精度计算,为万卡级智算集群提供算力支撑 [3] - “庐山”专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染等新技术 [5] 夸娥万卡智算集群与算力突破 - 发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理 [7] - 该集群浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达60%,在MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95% [7] - 推理侧,联合硅基流动在DeepSeek-R1 671B全量模型上实现单卡推理性能突破,MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s [7] - 训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈 [7] - 发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力 [7] 图形计算与具身智能布局 - 图形产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并将完整支持DirectX 12 Ultimate,与国产主流CPU及操作系统完成了全栈适配 [8] - 在核心渲染技术上取得两项关键突破:基于“花港”架构的硬件光线追踪加速引擎,可支持DirectX Raytracing;推出全自研的AI生成式渲染技术MTAGR 1.0 [8] - 发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建开发、仿真、训练的统一环境 [8] - 推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群的MT Robot具身智能解决方案 [8] - 公司计划于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [9] - MUSA生态还与合作伙伴在科学智能、量子科技、AI for 6G等前沿交叉领域展开探索 [10] 生态建设与开发者体系 - 公司认为生态体系是GPU行业的核心护城河与价值所在,致力于以开放创新深化与生态伙伴的协同,共同构建国产计算产业生态 [11] - 以摩尔学院为平台,已构建产教融合的开发者成长体系,目前汇聚近20万名开发者与学习者 [11] - 通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与 [11] 端侧计算产品 - 发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,提供50TOPS的端侧AI算力,实现了专业AI开发的“开箱即用”,并打破了Linux开发、Windows办公与Android应用之间的场景壁垒 [12] - 预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态 [12]
摩尔线程,展现最新成果
财联社· 2025-12-20 19:18
核心观点 - 公司举办首届开发者大会,发布历时五年研发的新一代全功能GPU架构“花港”,并基于此公布了两款核心芯片、万卡智算集群及个人AI终端产品,展示了从芯片到软件再到系统与终端的全栈技术布局,战略意图从单一硬件供应商转向平台级算力基础设施商 [1][17] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,采用新一代指令集,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成第一代AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [2] - 基于“花港”架构公布两款核心芯片规划:“华山”芯片主打AI训推一体与超智融合,内置新一代异步编程模型,拥有全精度MMA及MTFP8/6/4混合低精度计算技术 [3][4] - “庐山”芯片专攻高性能图形渲染,优化任务分配与平衡,其AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [4] 智算系统与性能展示 - 发布“夸娥”万卡智算集群,浮点运算能力达10Exa-Flops,在Dense大模型上的训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超过90% [6] - 展示与硅基流动合作的推理性能成果:在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [7] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [8] 软件生态与开发者工具 - 自研MUSA架构迎来全栈软件升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超过98%,通信效率达97% [9] - 明确开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [10] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [11] 终端产品与市场拓展 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [12][13] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,预装Qwen3-8B大模型,支持多操作系统,意图将MUSA生态从云端下沉至开发者桌面端 [14] 行业背景与战略定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [17] - 发展“主权AI”的核心在于算力自主、算法自强与生态自立,构建国产十万卡级别智算系统是必须完成的产业基础设施任务,且需构建易用的开发环境以留住开发者社群 [15] - 公司通过展示的全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [17] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4%,但相较于发行价涨幅仍超过481%,总市值维持在3121.46亿元 [16]
摩尔线程公布新GPU架构和万卡集群
观察者网· 2025-12-20 15:27
12月20日上午,刚刚登陆科创板的GPU新秀摩尔线程,召开了首届MUSA开发者大会(MDC 2025)。 会上,摩尔线程公布了新一代GPU架构"花港",AI训推一体芯片"华山",用于游戏和图形渲染等场景的 芯片"庐山",以及"夸娥"万卡训练集群等产品。 现场,中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲。他指出,发展"主权AI"是提升未 来国家竞争力的关键,其核心在于实现"算力自主、算法自强、生态自立"的完整体系。 霸狂女 为什么 "万卡甚至十万卡系统"是必选项 算力基石 模型时代的基本单位是集群总算力,不是单卡性能 预训练超大规模模型、服务国民级推理需求,需要 持续可用的万卡级训练集群 分布在全国的推理集群与第力网络 num SSICAL Partist 从主权 Al 角度 国产万卡/十万卡系统 = 本土大模型与行业模型的 "母机"与基座 图 郑纬民认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,虽然构建国产万卡乃至十万卡级 别的超大规模智算系统存在难度,但这是必须完成的产业基础设施任务。他特别指出,开发者是生态建 设的关键,国产芯片平台必须构建起友好、易用的开发环境,以有效服务开发者社群 ...
摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局
环球网· 2025-12-20 15:00
【环球网科技报道 记者 李文瑶】12月20日,摩尔线程在首届MUSA开发者大会(MDC 2025)上,系统展示了其在全功能GPU领域从架构 创新、集群能力到生态建设的突破。 其中最引人关注的是新一代GPU架构"花港"的亮相,以及可支撑万亿参数模型训练的"夸娥"万卡智算集群的实际效率披露。 架构迭代:"花港"亮相,双芯片路线瞄准AI与图形 大会的核心发布之一是新一代全功能GPU架构"花港"。根据摩尔线程公布的信息,该架构在计算密度上提升50%,效能提升最高达10倍, 并完整支持从FP4到FP64的全精度计算。尤为关键的是,架构层面集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供 了底层支持。 这一架构与产品路线的发布,标志着摩尔线程不再局限于单一场景的加速卡产品,而是向覆盖AI计算、图形渲染、科学计算等全场景 的"全功能GPU"平台迈进。在业内人士看来,这既是技术能力的体现,也是应对市场多元需求、构建更宽生态护城河的战略选择。 集群能力:万卡训练效率指标首度公开 如果说芯片架构是"点"的突破,那么集群能力则是"面"的验证。本次大会上,摩尔线程首次系统披露了其"夸娥"万卡智算集群的关键工程 效 ...
摩尔线程发布新一代GPU架构,打造MUSA生态对标英伟达CUDA
新浪财经· 2025-12-20 14:42
来源:钛媒体 图片由AI生成 登陆A股科创板引发国产芯片股狂欢后,市场对这家公司后续的研发、产品、经营愈发关注。 GPU行业的竞争,本质上也是开发者生态的竞争。为此,摩尔线程在12月20日-21日举办首届MUSA(MUSA Developer Conference)开发者大会。 在今天(12月20日)上午的发布会上,摩尔线程创始人、董事长兼CEO张建中发布了新一代GPU架构"花港",AI训推一体新GPU"华山",游戏领域专业图形 GPU"庐山"、智能SoC"芯片"长江等产品,以及KUAE万卡智算集群。 根据发布会现场的介绍,即将于2026年量产的相关产品较上一代性能大幅提升。而这背后,继续对标、追赶甚至挑战以英伟达为代表的国际领先芯片产品、 架构及生态,成为了发布会的隐含主题。 摩尔线程在经营模式、产品体系和发展方向上,也一直对标着英伟达,尤其是在生态和基础算力设施构建、对物理AI的布局、高毛利率等方面,相比于"国 产GPU四小龙"中刚刚上市的沐曦股份,以及宣布赴港IPO的壁仞科技等公司来说。 不过,摩尔线程也正在尝试超越英伟达。其高调宣扬的"全功能GPU",是尝试在一颗GPU芯片上集成支撑AI计算、图形渲染 ...
摩尔线程发布多项关键技术成果 董事长张建中:生态体系是GPU行业核心护城河
搜狐财经· 2025-12-20 14:05
央广网北京12月20日消息(记者 齐智颖)摩尔线程在首届MUSA开发者大会(MDC 2025)上发布了以自主MUSA统一架构为核心的全栈技术成果,全面展 示了公司在高端全功能GPU领域的关键突破与前瞻布局。 海淀区委书记、中关村科学城党工委书记张革在大会开场致辞中指出:"海淀区作为北京国际科技创新中心的核心区,以'国家所需'为导向,坚持走新时代 科技创新之路,始终把培育硬科技企业摆在重要位置。我们将聚焦'打造自主创新策源地和新兴产业集聚地'的目标,携手摩尔线程和各位开发者,共筑全国 GPU最优生态。" 中国工程院院士、清华大学计算机系教授郑纬民在发表主题演讲时指出,高端AI芯片从全球化分工时代发展到"主权AI"时代,发展"主权AI"是提升未来国家 竞争力的关键,其核心在于实现"算力自主、算法自强、生态自立"的完整体系。 本次大会上,摩尔线程集中发布了一系列技术与产品进展。该公司发布全功能GPU架构"花港","夸娥"万卡智算集群。据介绍,"花港"支持FP4到FP64的全 精度计算,密度提升50%,效能提升10倍。摩尔线程表示,未来将基于该架构推出高性能AI训推一体"华山"芯片与专攻高性能图形渲染的"庐山"芯片。 ...
能效提升10倍!摩尔线程最新发布
新浪财经· 2025-12-20 13:43
公司产品与技术路线 - 摩尔线程于2025年12月20日在北京举办首届MUSA开发者大会,这是国内首个聚焦全功能GPU的开发者盛会[1][10] - 公司计划于2026年发布新一代GPU架构“花港”,该架构具备新一代指令集,算力密度提升50%,能效提升10倍[1][3][10][12] - 基于“花港”架构,公司将发布两款芯片:新一代算力芯片“华山”和高性能图形渲染芯片“庐山”[5][6][14][15] - “华山”芯片支持AI训推一体、超智融合,支持构建超十万卡级AI工厂,其片间互联速度可达1314GB/s,并支持一个“超节点”部署1024个GPU[5][14] - “庐山”芯片的3A游戏性能将提升15倍[6][15] - 公司全功能GPU包含四大功能引擎:AI计算加速引擎、图形渲染引擎、物理仿真和科学计算引擎、超高清视频编解码引擎[3][12] - 公司的MUSA系统架构是支撑这些引擎的核心,类似于英伟达的CUDA,该架构已从2022年的“苏堤”迭代至2025年的“平湖”[3][12] - 公司发布KUAE万卡智算集群,其浮点运算能力达到10 Exa-FLOPS[8][17] 应用场景与生态建设 - 公司在开发者大会现场设置了近千平方米的展区,展示了国产GPU在AI大模型、Agent智能体、科学计算、空间智能、数字孪生、多媒体、6G试验网络等领域的最新应用[1][10] - 公司正将全功能GPU的应用拓展至量子科技、6G、具身智能、智能驾驶、智能农业等多个领域[8][17] - 具体合作包括:与玻色量子合作打造量子原生AI生成式模型;与中关村泛联院合作助力6G“通感算智”愿景[8][17] - 为培养开发者生态,公司成立了摩尔学院,截至12月用户量已接近20万[8][17] - 公司通过产教合作让大学生更早接触MUSA开发技能,并发布了面向个人开发者的AIBOOK笔记本,内置“长江”智能SoC芯片[8][17] 行业背景与战略定位 - 公司创始人张建中表示,人工智能基础设施离不开算力,公司旨在利用全功能GPU来建设该基础设施,以赋能“十五五”规划中的新兴产业和未来产业[3][12] - 集群化已成为AI大模型底层基础设施的普遍特征,正从千卡、万卡规模向十万卡规模持续进化[8][17] - 中国工程院院士郑纬民指出,实现“主权AI”需要算力自主、算法自强、生态自立三大支柱,其中生态自立尤为关键[9][18] - 当前国产芯片生态面临迁移成本高、工具链不成熟、文档社区支持不足等挑战,产业内存在接口标准不统一导致的碎片化问题[9][18] - 行业专家建议,应建立统一或高度兼容的接口标准,通过产业联盟推动联合优化,并在关键基础软件上形成共享的开放底座[9][18]
王江平:用上善AI的东方智慧,平衡技术发展的激进与焦虑
南方都市报· 2025-12-20 13:26
AI治理的核心理念与愿景 - 提出“上善AI”理念,以道家“上善若水”的东方智慧勾勒中国AI治理愿景,旨在平衡AI发展的激进与焦虑 [2][10] - 认为当前国际AI治理理念分歧大、阵营化趋势明显,国内AI监管需要一套科学、敏捷的框架体系 [2] - 将“上善AI”英译为“The Tao of AI”,旨在推动中国AI治理理念全球化,体现中国文化生命力 [10] AI技术演进与安全风险 - AI系统正从“技术工具”向“智能实体”转变,其正负面影响均将呈指数级扩大,但治理进展滞后于技术发展 [3][5] - AI安全风险正向内容生态、物理安全等领域传导,形成对经济社会稳定等宏观层面影响,并呈现层级穿透态势 [3] - 预计未来三到五年,AI领域性风险将呈现更多样化的形态 [3] - 大模型加速落地,由模型幻觉引发的内容风险成为热点,自动驾驶、具身智能发展带来物理世界安全风险 [3] 人机对齐的技术、挑战与重要性 - 人机对齐是智能时代核心议题,旨在确保AI系统的目标、行为和输出与人类价值观、意图及社会规范保持一致 [5] - 当前主流模型采用基于人工反馈的强化学习(RLHF)和检索增强生成(RAG)技术来实现对齐,以提高输出准确性、可靠性并减少模型“幻觉” [5] - 人机对齐面临挑战:人类价值观复杂动态,难以设定普适目标函数;数据偏差可能导致歧视性输出;为节省算力成本,一些模型公司可能降低对齐水平 [6] - 强调若对齐速度跟不上AI发展,可能出现由技术领先者单方面定义人类价值观的风险,因此治理和监管非常重要 [6] 主权AI与文化对齐 - 引用英伟达CEO观点,每个国家都需要自己的AI基础设施以保护文化和经济安全,使“主权AI”成为热门词汇 [7] - AI模型训练数据包含特定国家、文化元素,在不同地区应用时会体现各自特色,AI服务于本国利益离不开文化对齐问题 [7] - 文化对齐基本范畴包括价值观、制度、哲学,以及艺术、语言、习俗等 [7] “上善AI”理念的实践框架与原则 - 价值对齐应遵循“共通底线+多元分支+动态演变”根本原则,理解并适配人类价值观的多元结构 [8] - 制度对齐需通过法律、法规、标准与伦理准则等工具,将AI发展约束在符合社会共识的框架内 [8] - 哲学对齐核心是在智能时代重新定义“人类的位置”,划定“不可逾越的底线”与“合理探索的边界” [8] - 提出“四位一体”的AI治理框架体系,包括自律、社会监督(行业伦理委员会、第三方检测评估)、行政部门监管和司法,缺一不可 [10] - 倡导“敏捷治理”,与时俱进,既管住要害又为创新留足空间 [10] AI发展中的关键争议与应对 - AI时代存在“智能鸿沟”,技术垄断企业掌握先进技术和数据资源,弱势群体面临技术鸿沟、就业冲击等问题,双方在治理规则和利益分配上存在显著分歧 [11][12] - 主张遵循“天之道,损有余而补不足”,通过开源共享、技术转移和能力建设来填平AI鸿沟,让技术红利普惠 [12] - 对于AI监管松严之争,认为治大国若烹小鲜,不应过度干预技术发展,而应建立稳固的伦理底线和原则性指导,为创新留出空间 [12] - 指出中美人工智能博弈是一场双方都输不起的竞争 [12] - 针对“AI泡沫论”,认为真正的泡沫是“五色令人目盲”的狂热,应对之道在于“见素抱朴”,回归本质,关注技术是否解决真实问题,以“真需求”挤压泡沫 [12][13] 各相关方的行动建议 - 对于开发者与企业,建议在算法设计和产品理念中嵌入“利而不争”思维,优先考虑技术普惠性和社会价值,而不仅仅是商业回报 [13] - 对于监管机构,认为治理应像水一样柔而克刚,设定明确的伦理和安全边界(如“人机对齐”框架),但在具体技术路径上保持包容和开放,鼓励试错 [13] - 对于整个社会,应共同培养开放心态学习AI知识,同时坚守人的主体性和价值观,确保技术最终服务于人的全面发展 [13]