vLLM团队官宣创业:融资1.5亿美元,清华特奖游凯超成为联创
机器之心·2026-01-23 08:45

公司成立与融资 - 由开源大模型推理加速框架vLLM的创建者创立的人工智能初创公司Inferact正式成立 [1] - 公司在种子轮融资中筹集了1.5亿美元(约合10亿元人民币),公司估值达到8亿美元 [1] - 本轮融资由Andreessen Horowitz(a16z)和Lightspeed领投,Sequoia Capital、Altimeter Capital、Redpoint Ventures和ZhenFund也参与了投资 [4] - 1.5亿美元的种子轮融资规模超过了Mistral AI的1.15亿美元,是有史以来规模最大的种子轮融资之一 [4] 公司使命与定位 - 公司的使命是将vLLM发展成为世界领先的AI推理引擎,并通过降低推理成本、加快推理速度来加速AI的发展 [5] - 公司认为,AI行业未来面临的最大挑战不是构建新模型,而是如何以低成本、高可靠性地运行现有模型 [6] - 公司定位于模型和硬件的交汇点,与模型厂商合作确保新架构的首日支持,与硬件厂商集成新芯片,并支持大模型团队进行大规模部署 [12] 核心技术vLLM - 公司的核心是开源项目vLLM,这是一个于2023年启动的开源项目,旨在帮助企业在数据中心硬件上高效运行AI模型 [7] - vLLM最初由加州大学伯克利分校的天空计算实验室开发,现由PyTorch基金会负责管理,已吸引了来自整个AI行业的2000多名贡献者 [8] - vLLM是全球范围内最受欢迎的开源大模型推理加速框架,其GitHub仓库拥有68.2k个Star和12.8k个Fork [8] - vLLM支持了500多种模型架构,可在200多种加速器上运行,并支持着全球规模的推理 [12] - vLLM的推理能力在为Meta、谷歌、Character.AI等科技公司提供支持 [9] 团队与背景 - 公司的首席执行官Simon Mo是加州大学伯克利分校的在读博士生,也是vLLM的创始维护者之一 [9] - 公司成立于2025年11月,并于本周正式对外公布 [9] - vLLM项目的核心贡献者、清华博士游凯超是公司的联合创始人 [13] - 创始团队还包括Woosuk Kwon、Roger Wang、Joseph Gonzalez、Ion Stoica等人 [15] 行业背景与挑战 - 业界对于AI推理基础设施的重视程度正在急速提升 [4] - 当前用于大模型训练的AI集群,将在六个月内完全被用于推理,推理会逐渐消耗掉所有算力容量,并耗尽所有新增的容量 [11] 未来发展计划 - 公司的首要任务是继续支持vLLM作为独立的开源项目,并将改进成果分享给社区 [12] - 计划进一步提升vLLM的性能,深化对新兴模型架构的支持,并扩大对前沿硬件的覆盖范围 [12] - 公司的第二个目标是开发一款独立的商业产品,帮助企业在不同类型的硬件上更高效地运行AI模型 [12]

vLLM团队官宣创业:融资1.5亿美元,清华特奖游凯超成为联创 - Reportify