MindSpore

搜索文档
华为版CUDA,全面开源了
猿大侠· 2025-08-07 12:11
华为昇腾AI生态开源战略 - 公司宣布全面开源昇腾AI GPU的CANN软件工具包及Mind系列应用使能套件,支持开发者深度自定义开发[1][3] - CANN作为华为版CUDA,提供多层编程接口和算子加速库,构建针对昇腾硬件的AI应用生态[4][5] - 当前CANN 8.0提供社区版(新功能体验)和商业版(企业稳定版),均升级至8.2.RC1并新增适配12款操作系统[7] 挑战英伟达CUDA封闭生态 - 华为通过开源CANN打破CUDA仅支持英伟达硬件的垄断,避免开发者迁移时需重写代码的困境[7] - 配套自研框架MindSpore(类似PyTorch)形成原生AI软硬件方案,已支持PyTorch/TensorFlow等8种主流框架[8][15] - 联合行业发起《CANN开源开放生态共建倡议》,加速昇腾生态建设[11][12] GPU架构师创业公司Oxmiq Labs - 前AMD/英特尔高管Raja Koduri创立Oxmiq,专注GPU硬件IP授权及兼容第三方硬件的软件堆栈[14][17][18] - 硬件采用RISC-V架构GPU IP核OxCore,集成标量/矢量/张量引擎,支持芯片集系统OxQuilt灵活构建SoC[22][25] - 软件核心OXPython可无修改运行CUDA应用,初期将部署在Tenstorrent AI加速器而非自有硬件[29][30][31] 行业竞争格局变化 - 华为与Oxmiq分别从开源生态和跨平台兼容性切入,挑战英伟达CUDA的技术壁垒[7][27] - 两者战略差异:华为绑定昇腾硬件变现,Oxmiq软件独立于硬件授权[3][31] - 行业涌现多路径替代方案,最终推动开发者工具链多元化[9][32]
华为版CUDA,全面开源了
36氪· 2025-08-06 16:29
华为昇腾AI生态开源战略 - 公司宣布全面开源昇腾硬件使能软件CANN及Mind系列应用使能套件,支持开发者深度挖潜和自定义开发,加速AI创新 [3] - CANN作为华为版CUDA,提供多层编程接口,已升级至8.0版本,包含社区版(新功能体验)和商业版(企业稳定版),新增适配12款操作系统 [6] - 配套自研深度学习框架MindSpore(类似PyTorch),形成原生AI软硬件方案,并支持PyTorch、TensorFlow等8种主流框架与第三方库 [6][9] - 联合行业发起《CANN开源开放生态共建倡议》,意图打破英伟达CUDA封闭生态的垄断 [11] 挑战英伟达CUDA的新兴竞争者 - 传奇GPU架构师Raja Koduri创立Oxmiq Labs,定位为硅谷25年来首家GPU初创公司,专注GPU硬件IP与软件堆栈授权 [12][14] - 公司硬件方案基于RISC-V指令集,推出模块化GPU IP核OxCore及芯片集构建器OxQuilt,支持灵活配置AI训练/推理SoC [18][20] - 软件核心OXPython可无修改运行Python版CUDA应用,通过统一运行时OXCapsule实现跨硬件平台兼容,初期适配Tenstorrent加速器 [23] - 战略强调软件堆栈与硬件解耦,直接对标CUDA生态,降低开发者迁移门槛 [16][21] 行业竞争格局变化 - 华为与Oxmiq分别从开源生态和兼容层技术切入,挑战英伟达CUDA的封闭体系 [6][23] - 昇腾CANN开源可能吸引受限于CUDA绑定的开发者,而Oxmiq的跨硬件兼容方案瞄准多模态AI/图形工作负载 [6][16] - 两家公司均强调降低开发者迁移成本,通过工具链开放或代码兼容性争夺生态话语权 [3][23]
对标英伟达CUDA,华为宣布开源CANN
新浪财经· 2025-08-05 22:29
华为昇腾计算战略 - 公司宣布昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持开发者深度挖潜和自定义开发[1] - 公司AI战略核心是算力,坚持昇腾硬件变现[1] - CANN作为神经网络异构计算架构,连接上层AI训练框架和底层昇腾芯片,简化开发者调用底层算力的流程[1] CANN技术定位与竞品对比 - CANN作用类似英伟达CUDA、AMD ROCm、摩尔线程MUSA等,但CUDA凭借成熟生态构成英伟达核心护城河[1] - CUDA生态系统存在巨大迁移成本,开发者需重写代码并失去社区支持,而昇腾+CANN+MindSpore构成对标英伟达PyTorch+CUDA的原生方案[3] - CANN 8.0版本新增200+基础算子、80+融合算子、100+API,典型算子开发周期从2人月缩短至1.5人周[4] 生态兼容性与开放策略 - CANN已支持PyTorch、MindSpore、TensorFlow等主流框架及第三方库,实现分层深度开放以降低迁移门槛[5] - 公司向百度、科大讯飞、腾讯派遣工程团队,帮助优化基于CANN的代码,效仿英伟达早期推广策略[7] - 公司发起《CANN开源开放生态共建倡议》,联合AI领军企业、高校等共同构建昇腾生态[7] 华为开源布局与市场表现 - 公司2020年开源MindSpore框架,2024年以30.26%新增份额成为中国AI框架市场第一[8] - 通过开放鸿蒙、欧拉、高斯等基础软件,打破"封闭式发展"的行业质疑[8] 生态发展挑战 - CANN生态发展仅6-7年,易用性和丰富度仍落后发展18年的CUDA,需长期投入[7] - 行业认为构建竞争力软件生态需数年时间,开发者习惯培养是关键[7]
H20解禁,中美AI闭环竞赛开启
虎嗅· 2025-07-16 09:51
英伟达H20芯片解禁事件分析 - H20芯片是AI训练千亿大模型的核心动力 被比喻为AI时代的"发动机" [3] - 2024年H20为英伟达带来120-150亿美元收入 占中国区营收85% [7] - 禁售导致英伟达Q1损失25亿美元 预计两季度共亏损135亿美元 [9] 中美科技博弈新阶段 - 美国从全面封锁转向有限放水 形成新的平衡策略 [5][15] - 禁令倒逼中国加速国产替代 华为昇腾910B性能接近H20 [11][33] - 中国AI市场未停滞 反而推动国产芯片生态发展 [14] 中国市场变化 - 字节跳动和腾讯2024年采购23万枚Hopper系列芯片 [8] - 腾讯向字节跳动购买价值20亿元GPU算力资源 [28] - H20服务器价格从100万元涨至140万元 [30] 国产替代进展 - 华为昇腾 寒武纪等国产芯片性能显著提升 [11] - 国家发改委建议优先使用国产芯片 [34] - 华为MindSpore 百度PaddlePaddle等国产框架逐步完善 [35] 英伟达应对策略 - 强调高性能计算和生态兼容性优势 [40] - 尝试与小米等中国头部企业深化合作 [43] - 讨论基于CUDA的本地化AI训练方案 [46] 行业未来趋势 - 可能出现中美两个平行的AI技术世界 [52] - 中国正在构建芯片-框架-大模型-应用的闭环生态 [59] - 华为昇腾+MindSpore+Qwen形成自主技术体系 [60]
中美AI竞争报告:中国人工智能产业政策能否突破美国封锁?
36氪· 2025-07-01 15:53
中国人工智能产业政策 - 中国计划到2030年成为人工智能全球领导者,目标是将人工智能打造为价值1000亿美元产业,并在其他行业创造超过1万亿美元附加值 [2] - 政策工具包括82亿美元人工智能初创企业基金、国家集成电路网络、地方政府支持的人工智能实验室和试验区 [3] - 重点支持领域涵盖医疗保健、制造业、农业升级以及机器人、自动驾驶等硬科技新兴产业 [2] 政策实施与效果 - 中国人工智能模型性能正缩小与美国差距,应用场景在电动汽车、机器人、医疗等领域快速扩展 [1] - 国家支持叠加民营科技企业(如阿里巴巴、字节跳动)的数百亿美元投资,但总投资仍落后于美国(如OpenAI的1000-5000亿美元项目) [3] - 华为昇腾芯片等国产替代品在性能和产量上落后英伟达,目前基于华为硬件训练的公开模型不足十个 [6] 美国出口管制影响 - 美国对先进计算芯片的出口管制限制了中国企业的计算资源获取,迫使百度、字节跳动等公司缩减训练规模 [6] - 中国企业采取芯片囤积、海外建数据中心(如墨西哥、马来西亚)等策略规避管制 [7] - 软件生态上,华为MindSpore和百度PaddlePaddle作为PyTorch/TensorFlow替代品,但GitHub关注度仍较低 [7] 发展瓶颈与应对 - 三大关键瓶颈:国产芯片研发(如华为Ascend 910B)、人工智能人才短缺、数据中心能源需求(预计2030年增长三倍) [9] - 科大讯飞透露,从英伟达转向华为芯片导致模型开发延迟三个月 [9] - 私营部门主导创新,如DeepSeek等公司推动技术进步,但美国私人投资规模为中国企业的十倍 [11] 未来竞争态势 - 中国可能通过"自主可控"生态(芯片+软件)突破管制,但当前替代方案尚未成熟 [8] - 产业政策有效性取决于与民营生态协同,若脱离需求可能导致资源错配 [11] - 人工智能发展依赖快速创新范式(如推理模型),政府长期规划难度高于传统行业 [10]
独家揭秘!华为如何让万台AI服务器秒变「超级大脑」
第一财经· 2025-06-09 17:01
AI算力集群的关键特性 - AI算力集群通过连接上万台甚至几十万台计算机形成"算力航空母舰",以应对万亿参数大模型的计算需求[1] - 需要解决协同工作、高效运行和快速修复等世界级难题[1] 超节点高可用 - 算力集群采用"备用替身"机制,确保单台机器故障时任务无缝接管,避免全盘停止[3] - 华为提出系统层、业务层和运维层三级容错方案,将故障转为亚健康问题并优雅消除[3][4] 集群线性度 - 理想情况下算力应随计算机数量线性增长,华为通过精密任务分配算法实现接近完美的线性度[6] - 实验显示训练Pangu Ultra 135B模型时4K卡集群线性度达96%,Pangu Ultra MoE 718B模型8K卡集群线性度达95.05%[8] 万卡集群训练快速恢复 - 系统具备"存档功能",可在设备故障时从最新进度恢复,避免从头训练[10] - 华为创新技术将训练恢复时间缩短至3分钟内,部分场景可达30秒内[11] 超大规模MoE模型推理恢复 - 大EP组网架构下硬件故障可能导致整个推理实例不可用[13] - 华为三级容错方案将实例恢复时间从20分钟降至5分钟,TOKEN级重试实现30~60秒恢复[15] 故障管理与感知诊断 - 实时监控系统持续监测设备健康状态,快速定位并修复故障[17] - 华为提供完整的硬件灾备高可靠架构设计和RAS统一故障管理框架[17] 建模仿真 - 虚拟环境"数字化风洞"可预测模型真实表现,提前发现系统瓶颈[19] - 华为马尔科夫建模仿真平台在训练、推理和高可用领域实现系统性建模分析[19][20] 框架迁移 - 昇思MindSpore框架覆盖90%以上PyTorch接口,实现第三方框架无缝迁移[22] - 推理阶段支持HuggingFace权重一键部署,实现盘古72B模型推理性能提升[22] 总结与展望 - 华为在算力集群多个维度提出创新方案,形成完整技术体系[24] - 未来算力基础设施将走向算法-算力-工程协同进化,形成需求-创新-反哺闭环[24]
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
机器之心· 2025-06-09 12:33
AI算力集群的核心作用 - AI算力集群通过连接上万台甚至几十万台计算机形成"算力航空母舰",支撑大模型训练和复杂AI任务处理[3] - 单台计算机算力无法满足万亿参数大模型需求,集群化方案解决算力瓶颈问题[3] - 集群需要解决设备协同工作、故障容错、训练中断恢复等世界级工程难题[4] 超节点高可用技术 - 采用系统层/业务层/运维层三级容错方案,将故障转为亚健康状态并通过运维手段消除[7][8] - 系统层通过超时代答欺骗OS和网络路由切换防止系统级故障[7] - 业务层实现租户无感知的网络闪断重试,运维层构筑亚健康感知和优雅恢复技术[8] 集群线性度优化 - 通过拓扑感知协同编排(TACO)、网存算融合(NSF)等四项关键技术实现算力线性扩展[11] - 训练Pangu Ultra 135B模型时4K卡集群线性度达96%,718B稀疏模型8K卡集群线性度95.05%[13] - 理想状态下集群应实现算力与设备数量的线性增长,避免资源内耗[10] 万卡集群快速恢复 - 采用进程级重调度恢复技术将训练恢复时间缩短至3分钟内[15] - 进程级在线恢复技术针对硬件UCE故障实现30秒内恢复[15] - 算子级在线恢复技术实现网络故障下的秒级重执行,保持训练连续性[15] MoE模型推理容错 - 大EP组网架构下提出实例间切换/实例内重启/实例内无损三级容错方案[19] - 实例内快速重启技术将恢复时间从20分钟降至5分钟[20] - TOKEN级重试技术在CloudMatrix 384场景实现30-60秒实例恢复[21] 故障感知与诊断 - 构建全栈可观测能力,包括集群运行视图、网络链路监控等模块[26] - 建立全栈故障模式库,涵盖跨域诊断、计算节点诊断等能力[26] - 实时监控系统持续跟踪设备温度、算力利用率等健康指标[24] 建模仿真技术 - Sim2Train平台通过AdaptPack编排优化使训练吞吐提升4.5%-8.24%[31] - Sim2Infer推理仿真平台实现硬件指令自动化映射,平均误差6.6%[33] - 高可用仿真框架建模单步时长内的故障影响与恢复耗时[35] 框架迁移方案 - MindSpore通过MSAdapter工具覆盖90%以上PyTorch接口实现生态兼容[38] - 推理阶段支持HuggingFace权重一键部署,vLLM插件提升大模型服务能力[38] - 动态图执行通过多级流水线与JIT编译优化显著提升效率[38] 未来发展趋势 - 算法-算力-工程协同进化将形成"应用需求→硬件创新→工程反哺"闭环[39] - 算力专用化趋势下需异构加速,架构革新如光电混合将释放性能潜力[39] - AI运维等智能化手段将成为弥合系统复杂度鸿沟的关键[39]
穿越智算时代的供需鸿沟,华为的解题与破题
搜狐财经· 2025-06-01 04:41
智算产业发展现状 - DeepSeek的出现将智算产业推至新高度,模型训练成本较三年前下降85%,算力需求弹性扩大6倍,AI技术成为企业可负担的基础设施 [1] - 中国智算人工智能算力供给规模2024年底达1450EFlops,预计未来三年保持40%以上增长,2027年将达4080亿Flops [1] - 智算需求几何级数增长导致系统容错空间压缩,小问题可能阻碍行业发展 [1] 智算产业面临的挑战 - 大模型算力需求比硬件供给高出200倍,需计算-网络-存储系统化能力 [5] - AI技术加速渗透各行业带来场景融合难题,新兴场景缺乏最佳实践参考 [6] - 开发者生态面临工具链碎片化、学习成本高等挑战,产业协同存在供需错配和信任壁垒 [7] 华为的智算战略与创新 - 提供万卡、10E级规模AI集群,通过软硬件协同设计优化算力使用 [9] - 首创大规模专家并行方案提升资源利用率20%,面向全行业提供AI解决方案 [11] - 坚持"硬件开放、软件开源、使能伙伴、发展人才"战略,打造人工智能产业生态 [12] 华为的生态建设成果 - 硬件开放方面拥有14家OEM伙伴和50家APN伙伴 [14] - 软件开源社区MindSpore企业服务5500多个,社区下载量超1100万 [14] - 拥有2500多个行业合作伙伴和330万开发者,联合72所高校开展人才培养 [14] 华为的差异化优势 - 推出昇腾万里伙伴计划,每年投入10亿元专项资金推动生态繁荣 [17] - 依托计算和网络双重优势,实现算网融合创新 [18] - 通过零丢包无损网络技术提升算力资源利用率,显著改善智算中心性能 [20]
未知机构:脱水研报丨Q1需求、订单甚至业绩出现明显好转迹象,此行业利润率向上空间较大;国产算力佼佼者,一文梳理昇腾产-业链——0507-20250508
未知机构· 2025-05-08 11:55
纪要涉及的行业和公司 - **行业**:军工、国产算力、金属材料、智能驾驶 - **公司**:中简科技、泰嘉股份、宝钛股份、西部材料等众多军工产业链公司;昆仑技术、华鲲振宇等昇腾产业链公司;久立特材、西部超导等金属材料公司;比亚迪、吉利、奇瑞等智能驾驶相关车企,以及晶方科技、电连技术等智能驾驶产业链公司 纪要提到的核心观点和论据 军工行业 - **核心观点**:25Q1行业基本面或已处于复苏态势,看好全年业绩表现,利润率向上空间大,有望迎来高景气周期 [1][3] - **论据**: - 军贸方面,国际局势复杂,25年起多国提升国防预算,全球军费开支大幅增长,军贸市场活跃 [1][3] - 国内方面,25年是“十四五”末年,积压需求将快速释放,2月起部分企业基本面改善,航天、导弹细分方向明显,部分上游企业订单好转 [3] - 24年多因素致业绩下滑,25Q1虽行业因素影响仍在,但部分上游领域标的需求、订单和业绩好转,或进入反弹阶段 [4][5] - 近两年装备采购价格下降等致盈利能力下滑,24Q4为“十四五”以来最低点,25Q1毛利率和净利率环比改善,采购节奏回归正轨、招标模式优化为利润率提升创造空间 [7] - 近两年产业链推进能力建设,固定资产和在建工程增长,国内外需求共振下,后续需求放量时能力建设将发挥效用 [10] 国产算力行业(昇腾产业链) - **核心观点**:2024 - 2028年中国智算中心市场投资规模预计大幅增长,昇腾产业链将显著受益 [12] - **论据**: - 昇腾构建涵盖多方的强大生态体系,软硬件协同,硬件体系以达芬奇架构为基石,软件有对标英伟达CUDA的昇腾CANN和开源框架MindSpore,应用使能的MindX降低开发门槛 [13][14] - 昇腾产品矩阵完善,能适配多种模型,华为CloudMatrix384超节点集群上线,算力规模提升,性价比高,UB - Mesh架构降低成本、提升性能 [15] - 昇腾产业链各环节发展良好,整机有众多伙伴基于其产品二次开发;芯片性能升级带动电源价值量增长;单机柜功耗增加推动液冷技术应用;AI背板连接器需求旺盛 [19][20] 金属材料行业 - **核心观点**:AI融入材料研发体系,高端需求与AI技术双重驱动,关注具备数据沉淀优势与AI融合创新潜力的金属材料龙头 [21][24] - **论据**: - AI通过智能算法突破传统试错模式限制,提升研发效率,OMat24等开源材料大模型加速推动AI赋能材料发现 [21] - 行业层面,钢铁、有色行业部署专用工业AI大模型,推动传统制造向智能工厂转型 [23] - 需求端,高端制造前沿领域对金属材料性能要求升级,推动行业演进;技术端,AI为研发提供新工具,“技术—需求”共振使研发从经验驱动转向数据驱动 [24] - AI可帮助企业应对“五新”挑战,形成创新闭环,推动强者恒强,核心优势升级为综合实力 [24] 智能驾驶行业 - **核心观点**:比亚迪按下智驾下沉加速键,各车厂积极跟进,智驾下沉至中低端车型放量区,智能化硬件成长空间广阔,国产供应链有望深度参与 [2][27] - **论据**: - 比亚迪、吉利、奇瑞等厂商积极发布智能化战略,多款中低端车型搭载高阶智驾,新能源车销量增长,智驾配置向中低端渗透有望打开硬件成长空间 [28][29] - 智驾硬件产业链由感知、传输、计算构成,车载摄像头CIS成长空间广阔,高阶智驾车型CIS价值量高,高频高速连接器需求大,全球汽车连接器市场规模增长,中国市场机会好 [30][31] 其他重要但是可能被忽略的内容 - 军工行业24年业绩下滑明显,国防军工(中信)板块2024年营收4191.79亿元,同比 - 12.85%,归母净利润152.58亿元,同比 - 45.03%;25Q1收入773.29亿元,同比 - 14.36%,归母净利42.01亿元,同比 - 28.87% [4] - 2026年中国液冷数据中心规模有望达180亿元,2025年通信连接器市场规模将达600亿元 [20] - 2025年1 - 3月,新能源车销量为341.9万台,同比提升63.76%;2025年3月,新能源轿车5 - 10万、10 - 15万、15 - 20万售价车型占整体销量占比分别为34.8%、33.7%、8.7%;新能源SUV对应价格段占比分别为2.7%、25.0%、32.2% [29] - 到2025年,全球汽车连接器市场规模有望达到194.52亿美元,中国市场占比达23%,规模约为44.68亿美元 [31]
黄仁勋担心中国市场觉醒
36氪· 2025-05-08 11:02
AI工业革命 - AI工业革命是一场彻底重构生产体系、组织结构并重新定义人类价值的大变革[3] - AI作为数字劳动力和可批量制造的工业品将重塑企业运作方式并催生智能基础设施[4] - AI工厂与传统工厂形成"双工厂"模式 前者生产智能单元(Token)后者生产实体产品[9][10] AI工厂特征 - AI工厂依赖GPU集群、数据中心和算力资源 生产可调用的最小智能单元(Token)[7][8] - 一座AI工厂电力需求达1000兆瓦(1吉瓦) 相当于中型核电站 成本高达600亿美元[11][12] - AI工厂核心投入包括数万块GPU芯片、液冷系统、能源基础设施和数据采购[13] AI工厂战略意义 - 未来十年全球将出现数十座千兆瓦级AI工厂 总投资可能超过2万亿美元[14] - AI工厂分布将重塑全球经济格局 掌握工厂意味着掌握智能定价权和标准制定权[19] - 理想选址需满足电力充足、政策稳定 如美国得州、中东新能源基地和北欧国家[18] 中国市场影响 - 中国AI市场规模达500亿美元/年 放弃中国市场等于放弃技术主导权[21] - 技术出口限制加速中国构建自主AI产业链 华为已搭建完整AI工厂体系[24][25] - 中国AI标准可能形成覆盖23亿人口的"Token经济圈" 挑战美元结算地位[31] 全球供应链重构 - 中国AI标准将促使制造业版图重组 低端制造回流高端制造脱钩[29] - 采用中国标准的国家将形成对华为、阿里等技术"铁三角"依赖[30] - AI经济将改变GDP增长方式 未来国家竞争力取决于Token产能[33]