Workflow
Industry's First-to-Market Supermicro NVIDIA HGX™ B200 Systems Demonstrate AI Performance Leadership on MLPerf® Inference v5.0 Results
SMCISuper Micro Computer(SMCI) Prnewswire·2025-04-03 21:05

文章核心观点 - 超微电脑公司使用英伟达HGX™ B200 8 - GPU在多个MLPerf Inference v5.0基准测试中展现领先性能,相比前代系统有显著提升 [1] 公司表现 - 公司是唯一公布风冷和液冷英伟达HGX™ B200 8 - GPU系统创纪录MLPerf推理性能的系统供应商,风冷和液冷系统在MLCommons基准测试开始前已投入运行,工程师对系统和软件进行优化以展示出色性能,风冷B200系统在运行范围内与液冷B200系统性能相当,且在进行基准测试时已向客户交付系统 [2] - 公司的SYS - 421GE - NBRT - LCC和SYS - A21GE - NBRT系统在运行Mixtral 8x7B推理、专家混合基准测试时每秒生成129,000个令牌,风冷和液冷英伟达B200系统对大型Llama3.1 - 405b模型推理每秒超1,000个令牌,使用LLAMA2 - 70b基准测试时,安装英伟达B200 SXM - 180GB的系统在一级系统供应商中性能最高 [4] - 公司在多个具体测试中表现优异,如SYS - A21GE - NBRT在Stable Diffusion XL(服务器)测试中每秒查询数28.92排名第一,在llama2 - 70b - interactive - 99(服务器)测试中每秒令牌数62,265.70排名第一等 [5][6] 技术优势 - 公司的英伟达HGX B200 8 - GPU系统采用下一代液冷和风冷技术,新开发的冷板和250kW冷却液分配单元使4U外形尺寸的冷却能力比上一代提高一倍多,机架式设计的新垂直冷却液分配歧管不占用宝贵的机架单元,42U机架可容纳8个系统共64个英伟达布莱克韦尔GPU,52U机架最多可容纳12个系统共96个英伟达布莱克韦尔GPU [7] - 新型风冷10U英伟达HGX B200系统采用重新设计的机箱,有更大散热空间以容纳8个1000W TDP布莱克韦尔GPU,一个机架最多可安装4个新10U风冷系统,与上一代密度相同,但推理性能最高可达15倍,训练性能可达3倍 [8] 公司概况 - 超微电脑是全球应用优化型全面IT解决方案的领导者,致力于为企业、云、人工智能和5G电信/边缘IT基础设施提供率先上市的创新产品,提供服务器、人工智能、存储、物联网、交换系统、软件和支持服务等全面IT解决方案,产品在内部(美国、台湾和荷兰)设计和制造,利用全球运营实现规模和效率,优化以降低总体拥有成本和环境影响 [9]