Run:ai
搜索文档
华为发布AI容器技术Flex:AI,国产算力再次突破
中邮证券· 2025-11-24 13:50
行业投资评级 - 行业投资评级为“强于大市”并维持此评级 [1] 核心观点 - 华为发布并开源创新AI容器技术Flex:ai,通过算力切分技术将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%,旨在解决行业内算力资源平均利用率仅为30%至40%的难题 [4] - 在无法充分利用整卡算力的AI工作负载场景下,华为Flex:ai技术可使算力资源平均利用率提升30% [4] - Gartner预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行 [5] - 与英伟达Run:ai相比,华为Flex:ai在虚拟化、智能调度等方面具备独特优势,并秉持开源与兼容异构算力理念,可实现对英伟达、昇腾及其他第三方算力资源的统一管理和高效利用 [5] - 该技术是“以软件能力补齐硬件短板”的确定性突破,其核心围绕“XPU池化+算力细粒度切分+全局智能调度”三大支柱,致力于提升AI集群算力利用效率、降低生态迁移门槛、加速模型训练与推理落地进程 [6][7] 行业基本情况与表现 - 行业收盘点位为5068.36,52周最高点为5841.52,52周最低点为3963.29 [1] - 行业指数相对沪深300指数的表现数据涵盖从2024年11月至2025年11月,具体相对值变化区间为-13%至27% [3] 建议关注领域及公司 - 报告建议关注两大方向:AI容器技术领域与国产算力领域 [7] - AI容器领域建议关注公司包括:博睿数据、浩瀚深度、普元信息、青云科技、实达集团、首都在线、中亦科技、南威软件、浪潮数字企业 [7] - 国产算力领域建议关注公司包括:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力、烽火通信、广电运通、拓维信息、四川长虹、润建股份、数据港、润泽科技、光环新网、科华数据、奥飞数据、优刻得、立讯精密、安博通等 [7]
对标英伟达 华为开源AI容器技术Flex:ai 它可使算力平均利用率提升30%
每日经济新闻· 2025-11-21 23:08
行业背景与问题 - AI产业高速发展催生海量算力需求,但全球算力资源利用率偏低问题凸显,表现为小模型任务独占整卡导致资源闲置、大模型任务单机算力不足、大量通用服务器算力处于"休眠"状态 [1] - 供需错配造成资源浪费成为产业发展的关键桎梏 [1] 华为Flex:ai技术发布与特点 - 华为公司副总裁周跃峰在2025AI容器应用落地与发展论坛上发布AI容器技术Flex:ai [1] - Flex:ai通过算力切分技术将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10% [1] - 该技术实现单卡同时承载多个AI工作负载,在无法充分利用整卡算力的场景下,算力资源平均利用率可提升30% [1] - 在先进制程受限、单颗AI芯片性能与国外存在差距的现实中,Flex:ai延续了华为"以软件补硬件"的发展路径 [1] 与竞争对手Run:ai的对比 - 华为Flex:ai对标英伟达2024年底收购的以色列公司Run:ai [2] - Run:ai核心产品是基于Kubernetes的软件平台,可通过动态调度、池化和分片优化GPU资源使用,例如帮助Wayve公司将GPU集群效率从不足25%提升到80%以上 [2] - Flex:ai同样聚焦于通过软件创新实现对英伟达、昇腾等第三方算力的统一管理与调度,屏蔽底层硬件差异 [2] - 相比Run:ai主要服务于英伟达GPU生态,Flex:ai没有生态限制,支持英伟达GPU和华为昇腾NPU等算力卡 [2] 技术应用验证与行业趋势 - Flex:ai能力在瑞金医院联合打造的多模态病理大模型"RuiPath"中得到验证,该模型基于103万张病理切片数据训练,仅用16张昇腾910B算力卡完成大规模训练 [3] - Flex:ai通过算力资源切分、智能任务调度等技术,将XPU资源可用度从40%提升至70% [3] - Gartner预测到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行 [3] 开源策略与生态建设 - Flex:ai将在发布后同步开源在魔擎社区中 [3] - 该技术将与华为此前开源的多款AI工具共同组成完整的ModelEngine开源生态 [3]
Nvidia's internal emails reveal a 'fundamental disconnect' with major software clients
Business Insider· 2025-11-14 18:35
公司软件业务发展现状 - 公司在AI热潮中市值达到高点 成为首家市值5万亿美元的公司[1] - 公司正面临挑战 其全球现场运营部门的资深销售员工内部邮件揭示了在向客户讲述全面软件故事和销售软件产品时遇到的障碍[2] - 软件销售涉及Nvidia AI Enterprise (NVAIE) Run:ai Omniverse和vGPU等一系列产品[3] 公司软件产品详情 - Nvidia AI Enterprise (NVAIE) 是一套帮助客户开发自有AI应用程序的工具 于2021年推出 设计用于运行在公司的AI芯片和CUDA软件包上[4] - NVAIE的客户包括纳斯达克 美国国税局(IRS)和AT&T等[4] - 内部讨论聚焦于这些商业软件产品的销售 而非CUDA[4] 软件销售财务预测 - 公司主要业务是设计GPU和其他AI硬件 财报中未单独披露商业软件收入[5] - 软件业务规模较小 但有助于为公司更广泛的AI产品组合产生经常性收入并加深客户依赖[5] - 公司预测软件销售表现健康 其中第三财季北美和拉美地区独立软件销售预计达到目标的110% 而硬件捆绑软件销售预计仅达到目标的39%[6] - 当季整体软件销售预测为7870万美元 主要由NVAIE驱动 其预测达到目标的186%[6] 销售流程中的挑战 - 公司需要与销售伙伴和客户经理围绕NVAIE等产品制定全面软件故事 并计划为客户创建研讨会以规划AI项目[7] - 内部和与客户谈判时均需要额外的教育工作 最大痛点在于教育潜在客户的采购和法律团队理解AI Enterprise软件[8] - 公司与客户的法律和采购团队在理解软件销售流程上存在根本性脱节 尤其在金融和医疗等高度监管的行业[8] - 数据安全 赔偿义务以及客户要求高于公司承受范围的损害赔偿责任上限是谈判中的其他难点[9] 行业背景 - AI技术采纳不均衡的现象并非公司独有 一些公司认为这项热门技术尚处于早期 不适合广泛部署[10]