Workflow
苹果看上的公司,靠量子“邪修”给模型“瘦身”
虎嗅APP·2025-09-02 22:00

公司融资与估值增长 - 公司完成5轮融资 最新B轮融资额达1.89亿欧元[6] - 2024年3月完成2500万欧元A轮融资 估值1.08亿美元[6] - 一年后估值飙升至5亿美元 涨幅达5倍[6][8] - 成为西班牙最大AI初创公司之一[6][10] 核心技术CompactifAI - 采用量子物理张量网络方法压缩模型 体积减少80%-95%[6][13][14] - 准确率仅下降2-3个百分点[14] - 压缩后模型推理速度提升4-12倍[17] - 推理成本降低50%-80%[17] - 支持在PC、手机、汽车等终端设备运行[6][17] 产品应用案例 - SuperFly模型压缩自1.35亿参数SmolLM2 仅剩9400万参数[6][15] - ChickBrain模型压缩自18B参数Llama3 降至3.2B参数[6][15] - Llama 4 Scout Slim在AWS调用成本降至每百万tokens 0.10美元[17] - 相比原版每百万tokens节省30%费用[17] 商业模式 - 通过AWS API提供压缩模型服务[17] - 提供企业级私有部署许可[17] - 通过服务提供商交付定制化压缩模型[17] - 主要客户为大型互联网企业AI团队[18] 行业竞争格局 - Meta发布13亿参数LLaMA微型模型[22] - Google推出2亿-7亿参数Gemma模型[22] - 微软Phi系列14亿参数模型在专业任务超越大模型[22] - 初创公司Neural Magic、Deci等聚焦模型效率优化[22][23] - 与苹果、三星、Sony等硬件巨头洽谈终端设备合作[22] 技术壁垒与挑战 - 方法基于量子多体系统数学技巧 具强泛化性[11][14] - 需将大模型基础算子抽象为通用压缩工作流[14] - 端侧模型需适配不同设备的计算资源与能耗[23] - 当前技术依赖现有模型压缩 非自主训练小模型[24]