Penguin Solutions Releases ICE ClusterWare Management Software 13.0 for Optimizing AI Infrastructure
Businesswire·2025-11-18 00:00

产品发布核心信息 - Penguin Solutions发布ICE ClusterWare管理软件13 0版本 [1] - 该软件旨在解决生产级AI和HPC环境中的两大关键挑战:维持集群峰值性能和安全的资源分配 [1][2] - 软件计划于2025年12月2日正式上市 [8] 核心功能与技术特点 - 内置异常检测与自动修复技术,可持续监控传统诊断工具可能遗漏的隐藏性能下降问题 [4] - 系统能自动隔离性能不佳的节点并实时启动修复,确保工作负载被调度到经过验证的高性能节点上 [4] - 新的可选网络隔离多租户功能,支持安全高效地共享高价值GPU集群,为不同部门、项目或GPU即服务客户创建专用子集群 [5] - 多租户功能提供隔离环境,使租户能够自主选择工作负载管理器、管理用户并确保数据和操作的分隔与安全 [5] 解决的问题与客户价值 - 当企业的AI部署从孤立的试点项目转向企业级生产环境时,新软件可应对激增的基础设施运营需求 [3] - 主动式管理方法可减轻管理负担,防止计划外停机,并最大化集群可用容量 [4] - 通过减少重启和工作损失,新功能显著缩短模型训练时间 [4] - 减少以往因安全和资源利用冲突而迫使企业构建独立集群的情况,从而大幅提升价值实现时间 [7] 目标市场与应用场景 - 该能力对于提供GPU即服务的云服务提供商和超大规模运营商至关重要 [7] - 适用于向内部业务部门提供AI计算的企业和研究机构 [7] - 满足需要最高级别安全性和资源隔离的联邦或政府机构的需求 [7] - 客户案例显示,该技术对加速生物医学、生命科学和医学研究至关重要 [6] 公司背景 - Penguin Solutions是高性能计算和AI基础设施解决方案的领先提供商,在纳斯达克上市,代码为PENG [2][10] - 公司2025年营收为13.7亿美元,拥有2900名员工,总部位于加利福尼亚州弗里蒙特 [10][15]