CompactifAI

搜索文档
苹果看上的公司,靠量子“邪修”给模型“瘦身”
虎嗅APP· 2025-09-02 22:00
公司融资与估值增长 - 公司完成5轮融资 最新B轮融资额达1.89亿欧元[6] - 2024年3月完成2500万欧元A轮融资 估值1.08亿美元[6] - 一年后估值飙升至5亿美元 涨幅达5倍[6][8] - 成为西班牙最大AI初创公司之一[6][10] 核心技术CompactifAI - 采用量子物理张量网络方法压缩模型 体积减少80%-95%[6][13][14] - 准确率仅下降2-3个百分点[14] - 压缩后模型推理速度提升4-12倍[17] - 推理成本降低50%-80%[17] - 支持在PC、手机、汽车等终端设备运行[6][17] 产品应用案例 - SuperFly模型压缩自1.35亿参数SmolLM2 仅剩9400万参数[6][15] - ChickBrain模型压缩自18B参数Llama3 降至3.2B参数[6][15] - Llama 4 Scout Slim在AWS调用成本降至每百万tokens 0.10美元[17] - 相比原版每百万tokens节省30%费用[17] 商业模式 - 通过AWS API提供压缩模型服务[17] - 提供企业级私有部署许可[17] - 通过服务提供商交付定制化压缩模型[17] - 主要客户为大型互联网企业AI团队[18] 行业竞争格局 - Meta发布13亿参数LLaMA微型模型[22] - Google推出2亿-7亿参数Gemma模型[22] - 微软Phi系列14亿参数模型在专业任务超越大模型[22] - 初创公司Neural Magic、Deci等聚焦模型效率优化[22][23] - 与苹果、三星、Sony等硬件巨头洽谈终端设备合作[22] 技术壁垒与挑战 - 方法基于量子多体系统数学技巧 具强泛化性[11][14] - 需将大模型基础算子抽象为通用压缩工作流[14] - 端侧模型需适配不同设备的计算资源与能耗[23] - 当前技术依赖现有模型压缩 非自主训练小模型[24]
1年涨五倍,被苹果看上的“模型瘦身”公司靠谱吗?
虎嗅· 2025-09-02 13:21
公司背景与融资情况 - Multiverse Computing成立于2019年 最初聚焦量子计算软件解决金融领域投资组合优化和风险管理问题[5] - 公司完成5轮融资 2024年3月A轮融资2500万欧元 一年多后B轮融资达1.89亿欧元 估值从1.08亿美元涨至5亿美元 一年增长5倍 成为西班牙最大AI初创公司之一[2][4][6] - 团队40%成员拥有博士学位 核心成员横跨金融 量子物理与科技创业三大领域 CEO恩里克拥有数学 计算机 医学博士与MBA背景 曾任西班牙Unnim银行副CEO[5] 技术突破与产品发布 - 核心技术CompactifAI采用量子物理张量网络方法 能将大模型体积压缩80-95% 准确率仅下降2-3个百分点[8][11] - 2025年8月发布两款超小模型:SuperFly(苍蝇脑)基于1.35亿参数SmolLM模型压缩至9400万参数 ChickBrain(小鸡脑)将Llama 3.1 8B模型压缩至3.2B参数(压缩率60%)[12][13] - 压缩后模型推理速度提升4-12倍 推理成本降低50-80% 在AWS云服务上每百万tokens处理费用从0.14美元降至0.10美元 节省30%成本[16][18] 商业应用与合作伙伴 - 提供三种商业服务模式:AWS API访问 私有部署许可以及通过服务提供商交付压缩模型[16] - 主要客户为大型互联网和软件企业AI团队 应用于客服聊天机器人 代码自动补全和文本分析等场景[17] - 与苹果 三星 Sony HP等硬件巨头洽谈合作 计划将超小模型嵌入下一代终端设备 契合苹果轻量化本地模型战略[19] 行业竞争与市场定位 - 2024年起科技巨头纷纷布局小模型:Meta发布13亿参数LLaMA微型模型 Google推出2亿-7亿参数Gemma 微软Phi系列用14亿参数模型在数学编码任务超越50倍体积大模型[19] - AI推理优化成为创投圈新竞技场 初创公司Neural Magic Deci OctoML等聚焦模型加速和自动选型赛道[20] - 公司技术壁垒面临挑战 端侧模型需要配合设备计算资源 能耗和发热等工程化问题 且极度依赖原有模型能力[21][23] 技术原理与性能表现 - CompactifAI采用张量网络方法 通过张量分解和矩阵低秩近似重构参数逻辑 实现高维压缩并保留几乎所有信息[8][10] - 压缩后模型可在PC 手机 汽车等设备运行 将原需8张A100 GPU运行的LLM压缩至1-2张GPU甚至CPU上实时推理[16][18] - 已发布多个压缩模型版本包括Llama 4 70B精简版Llama 4 Scout Slim以及Llama 3系列和Mistral小模型精简版[11]
速递|量子学家重构AI压缩算法,Multiverse已筹集2.15亿美元,打造出史上体积最小两款模型
Z Potentials· 2025-08-15 11:53
公司概况 - 欧洲AI初创公司Multiverse Computing总部位于西班牙多诺斯蒂亚 在全球拥有约100名员工 [3] - 由量子计算机教授Romain Orús 量子计算专家Samuel Mugel及银行高管Enrique Lizaso Olmos联合创立 [4] - 公司专注于AI模型压缩技术 已筹集约2.5亿美元资金 其中最新一轮融资1.89亿欧元(约2.15亿美元) [4] 核心技术 - 开发量子启发的压缩算法CompactifAI 能在不牺牲性能的前提下缩小AI模型体积 [4] - 已发布多个开源模型的压缩版本 包括Llama 4 Scout Mistral Small 3.1及OpenAI新开源模型 [4] - 推出全球最小高性能微型AI模型系列"Model Zoo" 以动物大脑尺寸命名 [3][6] 产品特性 - SuperFly模型仅9400万参数(原模型1.35亿) 专为物联网设备设计 支持语音交互和故障排查 [6] - ChickBrain模型32亿参数 为Meta Llama 3.1 8B压缩版 在MMLU-Pro Math 500 GSM8K等基准测试中表现优于原模型 [6][7] - 模型可在iPhone Apple Watch MacBook及Arduino等设备本地离线运行 [3][6] 商业应用 - 技术已嵌入家用电器 实现语音控制设备操作 [6] - 与苹果 三星 索尼 惠普等主流设备制造商展开合作 惠普已成为公司投资者 [10] - 通过AWS API向开发者提供压缩模型 代币费用低于竞争对手 [11] - 客户包括巴斯夫 Ally 穆迪 博世等企业 覆盖图像识别等多种机器学习场景 [11]
Rime创投日报:更大力度培育壮大耐心资本、长期资本,优化“募投管退”-20250619
来觅研究院· 2025-06-19 16:25
报告行业投资评级 未提及 报告的核心观点 6月18 - 19日国内外创投市场活跃,有多起募资、融资和IPO事件,同时政策聚焦培育壮大资本和支持上海建设国际金融中心 [3][11][12] 根据相关目录分别进行总结 募资事件 - 幂方健康基金6月17日完成新一支美元VC基金募集,专注中国早期医药创新及生物医药前沿领域投资,已投资多个优秀项目 [3] - 6月17日郑州经开区首支产业创投母基金郑州经开赋豫战新创投母基金合伙企业完成备案,总规模50亿元,期限10年,首期5亿元,投资新能源等领域 [5] - 6月17日北京门头沟区举行京西瑞瓴基金启航仪式,目标规模30亿元,投向人工智能等产业 [6] 大额融资 - 6月18日帕西尼感知科技完成数亿元新一轮A系列融资,资金用于核心技术迭代等,产品线覆盖全链路并已批量商业交付 [7] - 6月18日欧冶半导体完成近1亿元B3轮融资,深化车载领域合作,拓展全球布局 [8][9] - 6月18日Multiverse Computing完成2.15亿美元B轮融资,用于加速量子软件技术采用,解决大语言模型成本问题 [10] 全球IPO - 6月19日海天味业登陆港交所主板,发行价36.3港元,认购额超4000亿港元,超购约695倍 [11] 政策聚焦 - 6月18日证监会主席吴清提出培育壮大耐心资本、长期资本,畅通私募基金“募投管退”循环,拓宽资金来源和退出渠道 [12][13] - 6月18日中央金融委员会印发意见,支持上海五至十年建成与我国综合国力和国际影响力相匹配的国际金融中心 [14]
速递|2.15亿美金豪赌AI瘦身术!Multiverse压缩LLM尺寸95%,让Llama在树莓派上狂奔
Z Potentials· 2025-06-13 11:17
融资情况 - 西班牙初创公司Multiverse Computing完成1.89亿欧元(约合2.15亿美元)B轮融资,由Bullhound Capital领投[1] - 参与机构包括惠普科技风投、SETT、Forgepoint Capital International、CDP Venture Capital等[1] - 公司累计融资达2.5亿美元[2] 技术优势 - CompactifAI技术可将LLMs模型尺寸缩减高达95%且不影响性能[2] - 提供Llama 4 Scout、Llama 3.3 70B等开源模型的压缩版本[2] - 计划发布DeepSeek R1压缩版,并开发更多开源推理模型[2] - 压缩后模型速度提升4-12倍,推理成本降低50%-80%[3] - Llama 4 Scout Slim版在AWS上每百万token成本为10美分(原版14美分)[3] 应用场景 - 压缩模型可运行于个人电脑、手机、汽车、无人机及树莓派等设备[3] - 模型通过亚马逊云服务提供或授权本地部署[2] 客户与专利 - 拥有160项专利和全球100家客户,包括Iberdrola、Bosch、加拿大银行等[2] 团队背景 - 联合创始人兼CTO Román Orús是张量网络领域开创者[3] - 联合创始人兼CEO Enrique Lizaso Olmos曾任西班牙Unnim Banc银行副首席执行官[4] 技术原理 - 张量网络技术能模拟量子计算机并在普通计算机上运行,主要用于压缩深度学习模型[4]