Workflow
华为,重大发布!
证券时报·2025-06-20 18:40

盘古大模型5.5发布 - 盘古大模型5.5在自然语言处理、多模态等5大基础模型全面升级,加速行业智能化 [1] - 发布盘古医学、金融、政务、工业、汽车五个行业自然语言大模型,6月底正式上线 [1] - 过去一年已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等关键领域 [1] 盘古Ultra MoE模型技术突破 - 推出参数规模达7180亿的盘古Ultra MoE模型,全流程在昇腾AI平台训练 [1] - 采用Depth-Scaled Sandwich-Norm架构和TinyInit小初始化方法,实现18TB数据长期稳定训练 [2] - 创新EP loss负载优化方法,提升专家负载均衡和领域特化能力 [2] - 使用MLA和MTP架构,结合Dropless训练策略,平衡模型效果与效率 [2] 训练方法升级与性能提升 - 在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习后训练框架 [3] - 预训练系统MFU从30%提升至41%,通过自适应流水掩盖、内存优化等关键技术 [3] - 盘古Pro MoE模型以720亿参数量实现媲美千亿级模型的性能,位列SuperCLUE榜单国内第一 [3] 昇腾平台全栈国产化意义 - 证明国产昇腾平台可高效训练国际顶尖水平的超大规模稀疏模型 [4] - 实现硬件到软件、训练到优化的全流程自主可控闭环 [4] 鸿蒙6操作系统生态进展 - 鸿蒙6首次亮相,带来更低时延和更开放AI能力 [4] - HMAF鸿蒙智能体框架赋能应用智能化升级 [4] - 生态加速发展,超30000个应用及元服务在开发中,覆盖20个行业 [5] - 注册开发者突破800万,面临百万级人才缺口 [5]