Workflow
昇腾AI计算平台
icon
搜索文档
英方软件发布鲲鹏备份一体机方案
新浪财经· 2025-09-19 10:33
产品发布 - 英方软件在华为全联接大会2025上发布鲲鹏备份一体机方案 [1] 技术认证 - 公司多款核心产品已通过华为鲲鹏技术认证与华为云兼容性认证 [1] 生态合作 - 产品与华为鲲鹏计算平台、昇腾AI计算平台及华为云GaussDB等技术体系深度融合 [1]
国泰海通|产业:华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系
华为AI发展战略 - 公司正通过从大模型设计到基础设施的软硬协同,构建全栈AI竞争力,策略从对标业界SOTA模型转向为自研昇腾硬件量身定制模型架构[1] - 双向协同进化路径旨在解决AI模型规模化应用中的系统性问题,构建由软硬件协同架构、算子与软件栈构成的全栈技术体系[1] 盘古大模型技术突破 - 盘古大模型核心为解决大规模分布式系统效率难题,聚焦混合专家(MoE)稀疏架构中的专家负载不均衡问题[1] - 公司创新方向从单纯硬件或算法问题拓展至在自研硬件上高效解决AI系统工程问题[1] 大模型创新路径 - Pangu Pro MoE采用分组专家混合(MoGE)架构,通过结构性设计解决负载不均衡问题[2] - Pangu Ultra MoE通过系统级优化和仿真先行设计方法适配昇腾硬件,实现训练与推理的协同优化[2] AI基础设施CloudMatrix - CloudMatrix以统一总线(UB)网络为核心技术,构建统一寻址的分布式高速内存池,降低跨节点通信性能差异[2] - 硬件发展为上层PDC分离架构等软件创新提供物理前提,支持大规模专家并行(LEP)和AIV-Direct等算子级优化[2]
产业深度:【AI产业深度】华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系
国泰海通证券· 2025-08-06 17:19
行业投资评级 - 报告未明确提及行业投资评级 [1][2][3][4][5][6] 核心观点 - 华为盘古大模型从追赶SOTA模型转向为自研异腾硬件量身定制模型架构,构建软硬一体AI技术体系 [4][12] - 盘古大模型演进路径:PanGu-α(2000亿参数)→ PanGu-Σ(1.085万亿参数稀疏架构)→ 盘古3.0("5+N+X"行业架构)→ 盘古5.5(全面拥抱MoE架构) [12][15][17][21][27][30] - Pangu Pro MoE采用分组专家混合(MoGE)架构解决负载不均衡问题,实现理论负载均衡 [37][38][45][46] - Pangu Ultra MoE通过仿真先行设计方法优化模型架构,在6000卡异腾集群上实现30%模型算力利用率(MFU) [64][68][71][82] - CloudMatrix基础设施通过统一总线(UB)网络和三平面架构支撑大规模AI推理,DeepSeek-R1模型推理效率达1.29 tokens/s/TFLOPS [88][93][97][102][113] 盘古大模型演进 - PanGu-α(2021年):基于2048颗异腾910和MindSpore框架训练,采用五维并行策略,验证全栈自主技术路线可行性 [12][13] - PanGu-Σ(2023年):1.085万亿参数稀疏模型,采用随机路由专家(RRE)和专家计算存储分离(ECSS)技术,训练吞吐量提升6.3倍 [15][17][18] - 盘古3.0(2023年):提出"5+N+X"三层架构,覆盖气象、药物分子等行业应用,千卡训练长稳率达90% [21][22][23][24] - 盘古5.5(2025年):推出Pangu Ultra MoE(718B参数)和Pangu Pro MoE(72B参数),全面优化MoE架构适配异腾硬件 [30][31][32] Pangu Pro MoE技术亮点 - MoGE架构将64专家分为8组,每组绑定1个NPU,强制每组激活1专家,实现理论负载均衡(IS=0) [45][46][54] - 训练阶段采用EP=2和PP=5流水线优化,MFU提升35%;推理阶段实现每卡1148 tokens/s吞吐量 [52][56][57] - 为异腾硬件定制MulAttention和SwiftGMM融合算子,注意力计算性能提升4.5倍 [59][61] Pangu Ultra MoE系统优化 - 通过仿真平台从10,000个候选配置中选出最优架构(61层/7680隐层/256专家),仿真与真实训练吻合度达90.1% [64][68][71] - 采用Dropless路由和EP-Group辅助损失,避免8% token丢弃率对模型性能的影响 [72][76] - 分层专家并行通信和自适应流水线重叠技术实现95%通信重叠率,训练效率提升58.7% [77][78][81][82] CloudMatrix基础设施 - UB网络实现NPU间164GB/s带宽和1.9μs延迟,跨节点性能衰减低于3% [102][121][122] - PDC解耦架构将Prefill、Decode与Caching分离为独立资源池,支持弹性伸缩 [97][98][101] - AIV-Direct通信机制绕过SDMA引擎,使通信延迟降低至微观指令级别 [108][109][132] - 异腾910C NPU采用AI Cube和AI Vector异构设计,支撑算子级深度融合 [132]
华为开源盘古7B稠密和72B混合专家模型
观察者网· 2025-06-30 10:38
模型开源与生态战略 - 公司正式开源盘古70亿参数稠密模型和盘古Pro MoE 720亿参数混合专家模型,并发布基于昇腾的模型推理技术 [1] - 此举是公司推进昇腾生态战略的关键举措,旨在推动大模型技术研究创新和AI行业应用 [1] - 盘古Pro MoE 72B模型权重和基础推理代码已上线开源平台,盘古7B相关模型将于近期上线 [1] - 公司计划首先开源盘古72B MoE模型,其次可能向高校开源小模型 [2] 模型性能与技术优势 - 盘古Pro MoE大模型在720亿参数、激活160亿参数情况下,性能可媲美千亿级模型 [1] - 该模型在SuperCLUE 2025年5月排行榜中位列千亿参数以内大模型国内第一 [1] - 盘古72B被专家称为"兼顾性能与推理成本的黄金尺寸",适合行业AI改造 [1] - 公司推出7180亿参数的盘古Ultra MoE新模型,全流程在昇腾AI计算平台训练 [2] - 盘古718B Ultra MoE万卡集群预训练MFU达到41%,实验室达45% [3] - CloudMatrix384超节点训练MoE大模型MFU超过50% [3] 技术架构与优化 - 昇腾超节点采用全对等高速互联架构,通过系统工程方法实现计算、内存、通信的极致优化 [3] - 结合昇腾特点的亲和设计和数学算法创新,实现超级并行 [3] - 欧拉操作系统优化升级将支持资源池化管理与调度,提升训练效率和推理性能 [3] 产品升级与服务 - 公司发布盘古大模型5.5,升级NLP、CV、多模态等五大基础模型 [3] - 基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线 [3] 生态建设与兼容性 - 昇腾算力能够训练世界一流大模型,具有训练高效率、推理高性能、系统高可用特点 [2] - 第三方模型可做到Day0迁移和一键部署到昇腾平台 [2] - 昇腾生态正在逐步完善,包括对业界主流生态的兼容 [2]
让人工智能跑出中国速度
经济日报· 2025-06-13 06:06
人工智能领域中国进展 - DeepSeek火爆全球 回击"中国做不出一流大模型"的论断 [1] - 华为推出参数规模7180亿的盘古Ultra MoE模型 全流程在国产昇腾AI计算平台训练完成 [1] - 中美人工智能竞争呈现"美强中快"动态变化 中国凭借应用创新、数据规模和政策驱动快速追赶 [1] - 中国在大模型领域走出"低成本、高性能"创新之路 [1] 算力竞争现状 - 算力是人工智能竞争重要战场 决定算法创新空间 [2] - 美国在核心算法、框架和先进算力领域占据优势 [2] - 国产算力在市场占有率、性能优化、生态成熟度等方面有待提高 面临技术封锁 [2] - 华为通过数学补物理、叠加和集群技术提升系统性能 达到世界先进计算水平 [2] - 国产算力有望实现从"可用"到"好用"的跨越 [2] 中国人工智能产业体系 - 中国构建全栈自主技术链条 缩小与世界顶尖水平差距 [3] - 昇腾算力平台训练效率高、推理性能好、系统运行稳定可靠 [3] - 中国人工智能专利全球最大 核心产业规模近6000亿元 企业数量超4700家 [3] - 算力规模全球前列 建成钢铁、煤炭等高质量行业数据集 [3] - 培育出竞争力强的通用大模型和行业模型 登上全球主流开源社区下载量榜首 [3] 未来发展重点 - 国产算力需在高端芯片架构、集群通信效率、软件生态等方面继续优化 [3] - 中国制造业增加值占全球比重约30% 是发展人工智能重要优势 [4] - 需在基础研究、生态构建、场景落地持续投入 才能跑出中国速度 [4]
华为发布准万亿模型Pangu Ultra MoE模型架构和训练细节
快讯· 2025-05-30 15:33
华为盘古Ultra MoE模型发布 - 公司推出参数规模高达7180亿的全新模型盘古Ultra MoE [1] - 该模型为全流程在昇腾AI计算平台上训练的准万亿MoE模型 [1] - 公司同时发布模型架构和训练方法的技术报告 [1] - 技术报告披露众多细节体现昇腾在超大规模MoE训练性能上的跨越 [1] 技术突破 - 训练超大规模和极高稀疏性的MoE模型极具挑战 [1] - 训练过程中的稳定性往往难以保障 [1] - 盘古团队在模型架构和训练方法上进行了创新性设计 [1] - 成功在昇腾平台上实现准万亿MoE模型的全流程训练 [1]
探寻产业发展“新引擎”• 特色产业集群 | “数智上海”:“智造”变“智算” AI产业集群成型
证券日报之声· 2025-05-10 01:11
上海人工智能产业集群发展 - 上海正以自主可控算力为支点推动多行业变革,涵盖传统产业智能化与现代服务业数字化升级 [1] - 宝钢智能车间AI质检系统精准率达96%,太保数据中心智能算法每秒处理数万次保险业务 [1] - 上海计划到2025年智能算力规模突破100EFLOPS,建成50个行业语料库示范应用和3-5个大模型孵化器 [8] - 2024年上海人工智能产业规模达4500亿元,同比增长7.8%,提前完成"十四五"目标 [8] 宝钢股份智能化转型 - 宝钢股份热轧车间采用AI模型预判炉况,冷轧车间"AI主操"实现秒级轧制规程调整,减少人为误差 [2] - 昇腾算力训练的高炉大模型使炉温预测准确率超90%,热轧AI缺陷识别准确率96%,年经济效益超千万元 [2] - 公司与华为昇腾合作构建云边端智能体系,计划2025年上线300个AI场景并打造5个标杆智能生产线 [3] 金融行业AI应用 - 太保科技构建保险业首个千亿级参数大模型,训练效率提升30%,理赔审核准确率提升59.4%,客户满意度80.5% [4] - 金融垂直大模型可处理健康险疾病风险评估等复杂场景,优化核保、理赔流程并形成行业知识壁垒 [5] - 太保科技基于华为鲲鹏实施"一云多芯"战略,30天完成60余个应用适配,推动保险系统国产化替代 [4] 上海超算中心与算力生态 - 上海超算中心昇腾Atlas900Pod集群运算速度达每秒10亿次,将AI训练周期从数周压缩至几天 [6] - 平台汇聚80余家企业机构,形成算法研发至商业转化的全产业链,如珑京信息推出智能体解决方案,新致软件聚焦金融AI转型 [6] - "超智融合"模式贯通基础研究到产业落地,上海电力大学风灵大模型降低风电运维成本30% [6] 政策与产业协同 - 上海"模塑申城"方案提出建设世界级AI生态,包括赋能中心、垂直模型训练场等 [8] - "基础平台+核心企业+场景应用"集群模式在AI与实体经济融合中形成示范效应 [7] - 上海超算中心通过"超算+智算"融合架构推动长三角智能化转型,助力芯片、工业软件等走向国际市场 [7]
AI领航制造行业新篇,携手华为共赢数智未来
搜狐财经· 2025-05-07 19:56
AI重构制造业 - AI技术对制造行业的降本增效及产业创新有巨大促进作用 [2] - AI已渗透到制造企业的研发、生产、供应链等环节,优化产品设计、缩短研发周期、提升生产效率、优化库存管理 [4] - AI技术引领制造企业向更高效、更智能的方向发展 [4] 华为的解决方案 - 公司通过"智能联接+智能存储+智能算力+智能平台"端到端全站解决方案,助力企业构筑新型基础设施 [5] - 昇腾AI计算平台和5G网络构建"算网大脑",实现算力毫秒级调度与高效利用 [7] - 云天筹AI求解器在医药物流中优化路径规划,使供应链综合成本降低3%,路径规划时间从3小时压缩至30分钟 [7] 基础设施的重要性 - 新型基础设施建设为数据流动、算力调度、智能应用提供底层支撑 [6] - 基础设施通过统一标准打破"数据孤岛",推动生产流程重构和商业模式创新 [6][7] - 夯实智能联接、存储、算力与平台四大底座是实现技术赋能与业务场景精准匹配的关键 [7] 行业合作与场景落地 - 公司与行业合作伙伴深度合作,构建联合解决方案,满足多样化AI算力需求 [8] - 围绕7大场景打造20多个解决方案,覆盖车辆装备、半导体电子、新能源、生物制药等行业 [8] - 2025年计划沿行业发展更多行业伙伴,共同深耕行业场景 [8] 公司定位与愿景 - 公司定位为制造业数智化转型的核心力量,推动行业创新前行 [9] - 坚定"加速行业智能化"发展目标,愿与企业携手开创制造业新篇章 [9]