Workflow
红帽宣布推出llm-d社区,NVIDIA、Google Cloud为创始贡献者
新浪科技·2025-05-27 11:42

红帽公司启动llm-d开源项目 - 全球开源解决方案提供商红帽公司宣布启动新开源项目llm-d,旨在满足生成式AI大规模推理需求 [1] - 该项目与CoreWeave、Google Cloud、IBM Research和NVIDIA合作打造,利用突破性的大规模生成式AI推理技术 [1] - 项目目标是让大语言模型(LLM)推理云能够满足最苛刻的生产服务级目标(SLO) [1] 行业背景与市场需求 - 据Gartner数据,到2028年80%以上的数据中心工作负载加速器将专门部署用于推理,而不是训练用途 [3] - 推理模型日益复杂和规模扩大导致资源需求持续攀升,限制了集中式推理的可行性 [3] - 成本过高和延迟过长可能使AI创新陷入瓶颈 [3] llm-d项目的技术优势 - 将先进的推理能力集成到现有的企业IT基础设施中 [3] - 统一平台使IT团队能够满足关键业务工作负载的各种服务需求 [3] - 部署创新技术以最大限度地提高效率,显著降低与高性能AI加速器相关的总体拥有成本(TCO) [3] 行业合作与支持 - llm-d已获得生成式AI模型提供商、AI加速器先驱和主要AI云平台组成的联盟支持 [3] - 创始贡献者包括CoreWeave、Google Cloud、IBM Research和NVIDIA [1][3] - 合作伙伴包括AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI [3] 行业领袖观点 - Google Cloud AI与计算基础设施副总裁Mark Lohmeyer表示高效AI推理对企业大规模部署AI至关重要 [4] - NVIDIA工程AI框架副总裁Ujval Kapasi称llm-d是对开源AI生态系统的重要补充,体现对生成式AI创新的支持 [4] - NVIDIA强调可扩展、高性能推理是下一波生成式AI和代理式AI的关键 [4]