AI模型压缩算法

搜索文档
速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元
Z Potentials· 2025-03-21 11:22
Pruna AI公司概况 - 欧洲初创公司专注于AI模型压缩算法研究 近期完成650万美元种子轮融资 投资方包括EQT Ventures、Daphni等机构 [2] - 公司开发了标准化AI模型优化框架 整合缓存、蒸馏等多种效率方法 并实现压缩模型的保存/加载标准化流程 [2] - 框架可评估压缩后模型的质量损失与性能提升 类比Hugging Face对transformers的标准化处理方式 [3] 技术方案与行业应用 - 支持多种AI模型类型(LLM/扩散模型/语音识别/CV) 当前重点聚焦图像视频生成领域 客户包括Scenario/PhotoRoom等企业 [4] - 独创压缩代理功能:用户设定速度与准确率阈值(如精度损失≤2%) 系统自动寻找最优压缩组合方案 [5] - 对比行业现状:大公司通常自建压缩技术 开源社区多为单一方法 Pruna的整合方案填补市场空白 [4] 商业化进展 - 采用云服务式计费模式 专业版按小时收费 类比AWS GPU租赁商业模式 [5] - 实证案例:将Llama模型体积缩小8倍且精度损失可控 显著降低客户推理成本 [5] - 企业版提供高级优化代理等增值服务 开源基础框架以扩大生态影响力 [4][5] 行业趋势 - 模型压缩已成行业刚需 OpenAI通过蒸馏技术开发GPT-4 Turbo Black Forest Labs推出Flux.1-schnell等优化版本 [4] - 蒸馏技术通过师生模型知识迁移 实现轻量化模型部署 主流厂商均采用类似方案 [4]