华为发布AI新技术

文章核心观点 - 华为公司发布并开源AI容器技术Flex:ai 旨在通过算力资源池化与智能调度解决全球算力资源利用率偏低的行业痛点提升AI工作负载与算力资源的匹配效率 [1][2] 技术发布与产学合作 - 华为公司副总裁周跃峰在2025AI容器应用落地与发展论坛上正式发布AI容器技术Flex:ai [1] - 华为联合上海交通大学、西安交通大学与厦门大学共同宣布将此项产学合作成果向外界开源 [1] - 该技术深度融合三大高校与华为的科研力量实现三大核心技术突破 [2] 行业背景与问题 - AI产业高速发展催生海量算力需求但全球算力资源利用率偏低的问题日益凸显 [2] - 算力资源浪费成为产业发展的关键桎梏具体表现为小模型任务独占整卡导致资源闲置大模型任务单机算力不足大量缺乏GPU/NPU的通用服务器处于算力休眠状态 [2] - 供需错配造成严重的资源浪费 [2] Flex:ai核心技术突破 - 算力资源切分技术由华为与上海交通大学联合研发可将单张GPU或NPU算力卡切分为多份虚拟算力单元切分粒度精准至10% [2] - 该技术实现单卡同时承载多个AI工作负载整体算力平均利用率提升30% [2] - 跨节点算力资源聚合技术由华为与厦门大学联合研发将集群内各节点的空闲XPU算力聚合形成共享算力池 [3] - 该技术可为高算力需求的AI工作负载提供支撑并让通用服务器通过高速网络将AI工作负载转发到远端资源池中的GPU/NPU算力卡中执行 [3] - 多级智能调度技术由华为与西安交通大学共同打造通过Hi Scheduler智能调度器自动感知集群负载与资源状态对本地及远端的虚拟化GPU、NPU资源进行全局最优调度 [3] 技术基础与开源影响 - Flex:ai XPU池化与调度软件基于Kubernetes容器编排平台构建通过对GPU、NPU等智能算力资源的精细化管理与智能调度实现精准匹配 [2] - 全面开源开放将向产学研各界开发者开放所有核心技术能力 [4] - 开源旨在汇聚全球创新力量共同推动异构算力虚拟化与AI应用平台对接的标准构建形成算力高效利用的标准化解决方案 [4]