Workflow
系统级软件创新
icon
搜索文档
阿里云AI成果入选顶会 GPU用量削减82%
财联社· 2025-10-19 13:47
文章核心观点 - 阿里云提出的计算池化解决方案"Aegaeon"成功入选顶级学术会议SOSP 2025,其技术通过GPU资源池化和Token级调度等创新,显著提升了GPU资源利用率,解决了AI模型服务中的资源浪费问题 [2] - 该方案在阿里云百炼平台的Beta测试中,将服务数十个720亿参数大模型所需的英伟达H20 GPU数量从1192个削减至213个,削减比例高达82%,大幅降低了硬件采购成本 [5] - 系统软件与AI大模型技术的融合成为行业新趋势,未来AI发展将更依赖于通过系统级软件创新来深度挖掘现有硬件的潜力,而非单纯依靠硬件算力增长 [4][9] Aegaeon系统技术原理与创新 - 系统通过GPU资源池化,打破了"一个模型绑定一个GPU"的低效模式,解决了因大量不常被调用的"长尾"模型独占GPU资源而导致的严重闲置问题,例如曾有17.7%的GPU算力仅用于处理1.35%的请求 [7][8] - Token级调度是核心创新,系统在每次生成下一个token后动态决定是否切换模型,实现精细化管理,并通过全栈技术将模型切换开销降低97%,支持亚秒级的模型切换响应 [8] - 系统支持单GPU同时服务多达7个不同模型,相比现有主流方案提升1.5-9倍的有效吞吐量,实现2-2.5倍的请求处理能力 [9] 行业影响与意义 - Aegaeon系统入选被誉为计算机操作系统界"奥斯卡"的SOSP顶级学术会议,其论文入选代表了操作系统和软件领域最具代表性的研究成果 [2][4] - GPU用量削减82%对于动辄使用成千上万张GPU的大型模型服务商至关重要,意味着公司硬件采购成本将显著降低 [5] - 如何从底层系统软件层面优化以支撑上层AI应用,已成为全球学术界和工业界关注的焦点,标志着行业发展趋势的转变 [9]