Workflow
华为首个!重磅发布!
证券时报·2025-06-30 12:37

华为开源大模型技术 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B模型性能 - Pro MoE 72B模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为开发者大会2025发布内容 - 公司发布盘古大模型5.5,包含五大基础模型,分别面向NLP、多模态、预测、科学计算、计算机视觉领域 [3] - 同时发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [3] 盘古Ultra MoE模型 - 公司推出参数规模高达7180亿的盘古Ultra MoE模型,是全流程在昇腾AI计算平台上训练的准万亿MoE模型 [4] - 发布该模型架构和训练方法的技术报告,披露众多技术细节 [4] 全栈国产化成果 - 盘古大模型基于昇腾云的全栈软硬件训练而成,实现从硬件到软件、从训练到优化的全流程自主可控 [4] - 在集群训练系统性能上实现业界领先,完成国产AI基础设施自主创新能力的验证 [4] 行业应用成果 - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 五大盘古行业思考大模型(盘古医学、盘古金融、盘古政务、盘古工业、盘古汽车)同步上线 [4] 开源战略意义 - 开源盘古模型有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [5] - 吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型赋能千行百业 [5]