Workflow
华为首个!重磅发布!
证券时报·2025-06-30 12:12

华为开源盘古大模型 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B性能表现 - 开源的Pro MoE 72B大模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为大模型技术进展 - 公司在2025年华为开发者大会上发布盘古大模型5.5,包含五大基础模型面向NLP、多模态、预测、科学计算和计算机视觉领域 [4] - 会上还发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [4] - 5月30日公司推出参数规模高达7180亿的盘古Ultra MoE模型,并发布相关技术报告 [4] 昇腾生态与国产化突破 - 盘古大模型基于昇腾云全栈软硬件训练完成,实现国产算力+国产模型全流程自主可控 [5] - 公司在集群训练系统性能上实现业界领先,完成从硬件到软件、从训练到优化的全栈国产化和全流程自主可控闭环 [5] 行业应用与落地 - 公司坚持"不作诗,只做事"战略,为千行万业提供智能化解决方案 [5] - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 公司同步上线五大盘古行业思考大模型(医学、金融、政务、工业、汽车) [5] 开源战略意义 - 开源举措有助于更多开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [7] - 开源将吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型更广泛赋能行业 [7]