华为缘何开源盘古大模型?
钛媒体APP·2025-06-30 11:23
华为开源盘古大模型 - 公司正式开源盘古70亿参数的稠密模型和盘古Pro MoE 720亿参数的混合专家模型 盘古7B相关模型权重与推理代码将于近期上线开源平台 [2] - 盘古Pro MoE 72B模型权重和基础推理代码已上线开源平台 基于昇腾的超大规模MoE模型推理代码也已上线 [2] - 70亿参数稠密模型参数量适中 性能均衡 部署门槛较低 适用于智能客服 知识库等多种场景 [2] - 720亿参数混合专家模型具有稀疏激活 动态路由和多专家协作特性 更适合处理复杂任务 [2] 开源战略与生态建设 - 公司选择两款用量较多的模型进行开源试验 未来可能继续开源更多模型 [3] - 开源基于昇腾的模型推理技术 旨在优化国产AI基础设施适配性 提升开发者调用体验 [3] - 盘古大模型加昇腾推理技术的开源 开放了国产AI技术栈 类比DeepSeek的开源策略 [3] - 公司推出基于CloudMatrix 384超节点架构的新一代昇腾AI云服务 并发布盘古大模型5.5 [3] 技术闭环与商业价值 - 盘古大模型从训练到推理深度依赖昇腾芯片 通过技术普惠和生态友好策略将硬件嵌入AI产业链 [4] - 开发者使用盘古模型需依赖昇腾芯片算力 企业落地应用需采购昇腾服务器或云服务 [4] - 开源大量推理技术旨在扩大盘古模型调用量和落地市场 形成从模型到硬件再到场景的闭环 [4] - 政企客户推动自主创新时 昇腾加开源盘古的组合更具竞争力 [4]