Workflow
见证历史!华为 重大发布
中国基金报·2025-11-21 17:49

核心技术特性 - 基于Kubernetes构建的XPU池化与调度软件,可将AI工作负载场景下的算力资源平均利用率提升30% [1] - 具备算力资源切分、多级智能调度、跨节点算力资源聚合三方面关键能力 [3] - 算力资源切分粒度精准至10%,实现单张GPU/NPU算力卡同时承载多个AI工作负载 [4] 核心竞争优势 - 相比英伟达Run:ai,具备虚拟化与智能调度两大独特优势 [5] - 虚拟化技术包括本地虚拟化和独有的“拉远虚拟化”技术,可将集群内各节点空闲XPU算力聚合形成共享算力池 [5] - 智能调度技术可自动感知集群负载与资源状态,结合AI工作负载优先级等多维参数进行全局最优调度 [5] 行业影响与定位 - 容器技术作为轻量级虚拟化技术,预计到2027年75%以上的AI工作负载将采用容器技术进行部署和运行 [3] - 技术是能够让AI行业化落地的重要工具之一,可提供提升算力资源利用率的基础能力并与业界结合行业场景完成落地探索 [1][9] - 开源有助于推动异构算力虚拟化与AI应用平台对接的标准构建,形成算力高效利用的标准化解决方案 [9] 生态战略布局 - 发布后同步开源至魔擎社区,旨在构建完整的ModelEngine开源生态 [1][6] - ModelEngine开源生态包含Nexent智能体框架、AppEngine应用编排、DataMate数据工程、UCM推理记忆数据管理器等AI工具 [6] - ModelEngine作为大模型训练、推理和应用开发的AI平台,提供从数据预处理到模型部署的一站式服务 [6]