Workflow
华为云发布盘古大模型5.5 新一代昇腾AI云服务上线
中国产业经济信息网·2025-06-30 10:09

盘古大模型5.5发布 - 盘古大模型5.5正式发布,包含自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型全面升级 [1] - 基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力 [1] - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域 [1] 自然语言处理NLP大模型升级 - 盘古NLP大模型推出718B深度思考模型,由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域大幅增强 [1] - 采用自适应快慢思考合一技术,实现模型根据问题难易程度自适应切换快慢思考,整体模型推理效率提升8倍 [1] 预测大模型创新 - 采用业界首创的triplet transformer统一预训练架构,将不同行业的数据进行统一三元组编码,提升预测精度和跨行业泛化性 [2] 科学计算大模型应用 - 深圳气象局基于盘古升级"智霁"大模型,首次实现AI集合预报,减少单一预报模型误差 [2] - 重庆市气象局打造"天资·12h"气象大模型,提升灾害天气日内预报预警能力 [2] - 深圳能源采用盘古进行中短期风光水发电量预测,减少发电侧弃电 [2] 计算机视觉CV大模型突破 - 发布全新MoE架构的300亿参数视觉大模型,为业界最大视觉模型 [3] - 支持图像、红外、激光点云、光谱、雷达等多维度感知、分析与决策 [3] - 通过跨维度生成模型构建工业场景稀缺的泛视觉故障样本库 [3] 多模态大模型创新 - 发布基于盘古多模态大模型的世界模型,为智能驾驶、具身智能机器人训练构建数字物理空间 [3] - 在智能驾驶领域可生成行车视频和激光雷达点云数据,降低路采成本 [3] 昇腾AI云服务升级 - 新一代昇腾AI云服务基于CloudMatrix 384超节点,将384颗昇腾NPU和192颗鲲鹏CPU全对等互联 [4] - 单卡推理吞吐量达2300 Tokens/s,提升近4倍 [4] - 支持"一卡一专家"模式,一个超节点可支持384个专家并行推理 [4] - 算力有效使用率(MFU)提升50%以上 [4] 大模型训练能力 - 可将432个超节点级联成最高16万卡的超大集群 [5] - 支持"日推夜训"训推算力一体部署 [5] - 已为科大讯飞、新浪、硅基流动、面壁智能、中科院、360等超过1300家客户提供AI算力 [5]