Workflow
动态负载均衡
icon
搜索文档
DeepSeek悄悄开源LPLB:用线性规划解决MoE负载不均
机器之心· 2025-11-20 23:13
项目概述 - DeepSeek在GitHub上开源了一个名为LPLB的新代码库,该项目全称为基于线性规划的负载均衡器 [1][2][5] - 该项目旨在利用线性规划算法优化混合专家模型中的专家并行工作负载分配,以解决训练过程中的动态负载不均衡问题 [5][9] - 尽管项目在GitHub上的star数量尚未超过200,且关注度不高,但有观点认为这表明公司正在为解决模型正确性和吞吐量瓶颈做准备 [1] 技术原理与流程 - LPLB通过三个核心步骤实现动态负载均衡:动态重排序、构建副本以及针对每个批次的数据求解最优的Token分配方案 [5] - 其专家重排序过程由EPLB协助完成,实时工作负载统计信息可通过用户提供、torch.distributed收集或直接从Deep-EP缓冲区获取 [6] - 求解器使用了内置的线性规划求解器,实现了单流式多处理器内点法,并利用NVIDIA的cuSolverDx和cuBLASDx库进行高效线性代数运算 [6] - 该方案将负载均衡的抽象提升到了pipeline层级,其求解过程非常轻量化,不会占用过多计算资源 [6] 性能与优化 - LPLB通过求解线性规划问题,在遵守边容量限制的前提下,沿冗余专家形成的连接边重新分配Token,以最小化专家并行组内的负载不均衡 [11] - 通信优化方面,实时工作负载的同步使用NVLINK和NVSHMEM进行优化,替代了传统的torch.distributed.allreduce,从而大幅降低通信开销 [11] - 求解器在节点内优化大约需要100微秒,对于非常小的批次大小,此延迟可能不可忽略 [11] 拓扑结构 - LPLB允许通过修改r2o矩阵来定义专家副本的分布方式,支持几种典型拓扑结构,包括立方体、超立方体和环面 [14][17] - 立方体拓扑要求在GPU子集上复制专家,形成带有对角边的立方体图,且每个GPU至少需要2个专家,适合在8 GPU的EP子组内进行平衡 [17] - 超立方体拓扑类似于立方体但不包含对角边,需要16个GPU,适合跨16个GPU的专家并行 [17] - 环面拓扑在同一节点内的邻居GPU上复制一个专家,在邻节点的GPU上复制另一个专家,形成环面图,对全局平衡有效但效率通常低于立方体 [17] 项目阶段与意义 - 该项目目前处于早期研究阶段,性能改进情况仍在评估中,尚未被用于生产流程 [8] - 该库的创新点在于引入线性规划这一数学工具来实时计算最优分配,并利用底层的NVSHMEM技术来打破通信瓶颈 [15] - 该项目本质上是试图解决大模型训练中的“木桶效应”问题,即训练速度往往取决于负载最重的那个GPU,对于研究MoE架构训练加速的开发者而言是一个有价值的参考实现 [15]
位于湘江新区,这个大型商场月底亮相
长沙晚报· 2025-11-04 19:13
项目概况与规模 - 永旺梦乐城湘江新区项目总建筑面积达23.62万平方米,建设内容包括1栋4层购物中心及1栋6层停车楼 [3] - 项目定位为集餐饮、家具家居、特色休闲娱乐于一体的绿色三星级商业综合体 [3] - 项目已全面竣工,计划于11月底正式开业 [1] 工程建设与效率 - 项目团队采用多种高效施工方法,包括土方内转挽回工期20余天,以及“空间换时间”的并行施工法 [3] - 通过动态负载均衡的人员设备调配及劳动竞赛,项目从开工到竣工仅用400天,较同类项目整体缩短工期近4个月 [3] - 项目应用BIM技术进行全生命周期管理,优化管线排布,并统一对接上游厂家以确保设计落地效果 [3] 绿色建筑与可持续性 - 项目以获取“绿建三星 + LEED金奖”认证为目标,广泛采用低碳机电设备,预计年减少碳排放1000余吨 [5] - 项目使用低流量节水洁具,较LEED基准节水超过50%,并建造1000立方米雨水回收系统用于全场绿化 [5] - 材料选型兼顾标准与前瞻性,团队完成200余项材料认样,严格审核色泽及环保指标 [5] 社区关系与社会影响 - 项目施工区域距最近居民区不足50米,项目党支部与属地社区签订结对共建协议,并开展公益活动以获取理解支持 [5] - 项目建成后将服务周边数十万居民,极大提升湘江新区商业配套水平,激活区域消费潜力 [6] - 项目将为当地居民提供便捷、舒适、高品质的消费体验,成为城市新地标 [1][6]