速递|2.15亿美金豪赌AI瘦身术!Multiverse压缩LLM尺寸95%,让Llama在树莓派上狂奔
Z Potentials·2025-06-13 11:17
融资情况 - 西班牙初创公司Multiverse Computing完成1.89亿欧元(约合2.15亿美元)B轮融资,由Bullhound Capital领投[1] - 参与机构包括惠普科技风投、SETT、Forgepoint Capital International、CDP Venture Capital等[1] - 公司累计融资达2.5亿美元[2] 技术优势 - CompactifAI技术可将LLMs模型尺寸缩减高达95%且不影响性能[2] - 提供Llama 4 Scout、Llama 3.3 70B等开源模型的压缩版本[2] - 计划发布DeepSeek R1压缩版,并开发更多开源推理模型[2] - 压缩后模型速度提升4-12倍,推理成本降低50%-80%[3] - Llama 4 Scout Slim版在AWS上每百万token成本为10美分(原版14美分)[3] 应用场景 - 压缩模型可运行于个人电脑、手机、汽车、无人机及树莓派等设备[3] - 模型通过亚马逊云服务提供或授权本地部署[2] 客户与专利 - 拥有160项专利和全球100家客户,包括Iberdrola、Bosch、加拿大银行等[2] 团队背景 - 联合创始人兼CTO Román Orús是张量网络领域开创者[3] - 联合创始人兼CEO Enrique Lizaso Olmos曾任西班牙Unnim Banc银行副首席执行官[4] 技术原理 - 张量网络技术能模拟量子计算机并在普通计算机上运行,主要用于压缩深度学习模型[4]