Workflow
盘古Pro MoE 72B
icon
搜索文档
媲美千亿级模型,华为首个开源大模型上线
选股宝· 2025-07-01 07:32
华为开源大模型技术 - 华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - Pro MoE 72B大模型在参数量720亿、激活160亿参数量的情况下,通过动态激活专家网络设计,实现媲美千亿级模型的性能表现 [1] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [1] - 华为云计算CEO表示开源有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态,并推动大模型赋能各行业 [1] - 招商证券指出华为盘古5.5发布718B参数MOE架构大模型,涵盖自然语言、视觉、多模态等领域,并推出"世界模型"赋能自动驾驶等行业应用 [1] 华为AI算力解决方案 - 华为提供从昇腾芯片、CANN异构计算架构、超节点到盘古大模型的完全自主、深度优化的闭环解决方案 [2] - 昇腾超节点已在中国电信等数据中心商用落地,带动国内供应链发展 [2] - 全球AI算力竞争转向大规模系统效能、生态构建与产业链能力全面对抗,华为重塑中美对立下的新算力格局 [2] 相关公司动态 - 华胜天成与华为在昇腾芯片、AICC智能联络中心等方向展开广泛协作 [3] - 软通动力推出软通昇腾AI工作站,提升AI本地化推理与生产效率 [4]
华为首个!重磅发布!
证券时报· 2025-06-30 12:37
华为开源大模型技术 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B模型性能 - Pro MoE 72B模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为开发者大会2025发布内容 - 公司发布盘古大模型5.5,包含五大基础模型,分别面向NLP、多模态、预测、科学计算、计算机视觉领域 [3] - 同时发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [3] 盘古Ultra MoE模型 - 公司推出参数规模高达7180亿的盘古Ultra MoE模型,是全流程在昇腾AI计算平台上训练的准万亿MoE模型 [4] - 发布该模型架构和训练方法的技术报告,披露众多技术细节 [4] 全栈国产化成果 - 盘古大模型基于昇腾云的全栈软硬件训练而成,实现从硬件到软件、从训练到优化的全流程自主可控 [4] - 在集群训练系统性能上实现业界领先,完成国产AI基础设施自主创新能力的验证 [4] 行业应用成果 - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 五大盘古行业思考大模型(盘古医学、盘古金融、盘古政务、盘古工业、盘古汽车)同步上线 [4] 开源战略意义 - 开源盘古模型有助于开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [5] - 吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型赋能千行百业 [5]
华为首个!重磅发布!
证券时报· 2025-06-30 12:12
华为开源盘古大模型 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B性能表现 - 开源的Pro MoE 72B大模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为大模型技术进展 - 公司在2025年华为开发者大会上发布盘古大模型5.5,包含五大基础模型面向NLP、多模态、预测、科学计算和计算机视觉领域 [4] - 会上还发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [4] - 5月30日公司推出参数规模高达7180亿的盘古Ultra MoE模型,并发布相关技术报告 [4] 昇腾生态与国产化突破 - 盘古大模型基于昇腾云全栈软硬件训练完成,实现国产算力+国产模型全流程自主可控 [5] - 公司在集群训练系统性能上实现业界领先,完成从硬件到软件、从训练到优化的全栈国产化和全流程自主可控闭环 [5] 行业应用与落地 - 公司坚持"不作诗,只做事"战略,为千行万业提供智能化解决方案 [5] - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 公司同步上线五大盘古行业思考大模型(医学、金融、政务、工业、汽车) [5] 开源战略意义 - 开源举措有助于更多开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [7] - 开源将吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型更广泛赋能行业 [7]