算力优化

搜索文档
华为“数字化风洞”小时级预演万卡集群方案,昇腾助力大模型运行“又快又稳”
第一财经· 2025-06-11 20:12
大模型训推系统的效率挑战 - 超过60%的算力浪费在硬件资源错配与系统耦合上,传统优化方法难以解决芯片特性的"三角矛盾"(算力-带宽-容量失衡)[1] - 大规模训练集群存在利用率黑洞,MoE模型需要精准平衡计算与内存配比,极致压缩通信占比,否则效率骤降[3] - 动态实时推理系统任务两极分化,需同时满足高吞吐与低延迟,在不同任务场景实现动态效率最优[3] 数字化风洞技术 - 在虚拟环境中"彩排"AI模型训推,模拟不同参数、输入和资源分配方案,提前发现计算系统瓶颈点和逻辑漏洞[2] - 华为构建昇腾"数字化风洞",能够小时级预演万卡集群方案,通过性能加速与高可用性实现大模型"又快又稳"运行[2] - 动静态融合的大规模训练集群建模仿真方法,通过有向无环图精准刻画模型对计算、内存、通信的需求[7] Sim2Train训练集群优化 - 通过全量部署空间搜索、动态性能感知调度优化等技术释放算力潜能,实现并行配置、内存管理等小时级自动寻优,支撑MFU达成41%[4] - 负载-软件-硬件协同优化范式发现最优设计与优化方案,包括模型结构智能搜索、全栈架构建模与策略联合优化等[7] - 实现毫秒级资源再平衡与故障容错,保障作业万级小时无间断运行[3] Sim2Infer推理系统优化 - 通过推理服务多层级量化建模、动态智能优化等技术,实现高性能动态专家激活、自适应混合精度推理等,端到端推理性能提升30%+[5] - 构建多层次推理系统建模仿真,集成负载特征建模、层次化系统架构分析等五大核心功能模块[10] - 通过多维代价模型建模实现软硬件协同推理加速创新,在昇腾平台上综合实现推理性能提升30%+[10] Sim2Availability高可用架构 - 通过随机优化搜索、灵敏度分析等技术实现集群硬件架构可靠性瓶颈定位及优化,支撑万卡集群分钟级快恢,可用度达成98%[9] - 硬件故障模式全栈监控,通过马尔科夫链刻画系统随机行为,构建状态转移模型[9][11] - 软件统一协同管控仿真,通过动态规划弹性调度、极致去冗余并行掩盖优化等技术提升算力系统可用度[11] 未来发展方向 - 随着新型应用快速变化和系统架构持续创新,算力基础设施的架构设计与优化空间持续激增[12] - 需要深化负载自动图化建模、多维架构耦合仿真等关键技术,在系统瓶颈分析、最优部署策略求解等领域发力[12] - 推动国产算力基础设施建设与AI计算技术创新,助力华为昇腾集群高效平稳运行[12]
新能源及有色金属日报:节后下游采购情绪一般,但宏观因素仍偏利好-20250604
华泰期货· 2025-06-04 11:01
节后下游采购情绪一般 但宏观因素仍偏利好 新能源及有色金属日报 | 2025-06-04 市场要闻与重要数据 期货行情: 2025-06-03,沪铜主力合约开于 77920元/吨,收于 77650元/吨,较前一交易日收盘0.06%,昨日夜盘沪铜主力合约 开于 77,910元/吨,收于 78,180 元/吨,较昨日午后收盘上涨0.50%。 现货情况: 据 SMM 讯,昨日日内各个品牌电解铜差异明显,盘初持货商报好铜如金川大板、贵溪等升水320-370元/吨,鲁方、 祥光、JCC升水300元/吨附近,而常州地区铁峰、豫光以及上海地区进口金冠金凤等近仅升水150元/吨附近。随着 低价货源成交,整体报价下移,金川等升水300元/吨成交,JCC货源紧张且江西门市消费较好近期来沪货源紧张, 日内成交200-250元/吨。节后首日下游消费清淡,采购情绪下降,且随着价格走跌,下游还盘心理明显。进入第二 交易时段,铁峰、大江PC等成交100-120元/吨,临近上午交易时段末低于百元每吨以下货源亦有成交。非注册紧张, 成交于升水20-50元/吨。 今日仍有进口货源到货,日内上海地区货源虽小幅减少但后续仍有入库,预计今日低价 货源 ...