Workflow
3年干出280亿估值AI独角兽,AI创业的最佳路径是什么?
创业创业(US:VEMLY) 虎嗅·2025-10-23 14:53

公司创始人背景与技术根基 - 创始人乔琳拥有复旦大学计算机科学本科与硕士学位,以及加州大学圣巴巴拉分校计算机科学博士学位,具备横跨中外的学术经历和扎实的理论功底 [1] - 在Meta公司主导PyTorch生态建设,带领300余人工程团队重构其底层架构,使其从科研工具成功适配数据中心、移动端及AR/VR设备,构建从模型研发到生产部署的全链路平台,成为全球AI框架生态的核心奠基人之一 [1][2] 公司创立与核心技术 - 乔琳离开Meta后创立Fireworks AI,专注于解决大模型推理的"效率痛点" [2] - 公司研发两大核心技术:Fire Attention推理引擎通过无损量化压缩技术将模型运行精度从16位降至8位甚至4位,大幅减少资源消耗;推测执行引擎通过一次预测多个词序列再反向验证,打破逐字生成的传统模式 [2][3] - 两项技术叠加使主流开源模型的推理速度较行业标杆vLLM提升12倍,同时成本降低53% [3] - 公司定位为同时具备开源灵活性与闭源易用性,并以"轻量"为优势提供定制化服务 [6] 商业模式与市场定位 - Fireworks AI采用"算力调度师"的轻资产模式,不直接购买硬件,而是整合全球科技公司、高校实验室的闲置GPU资源 [9] - 客户通过API上传数据即可调用整合后的算力,例如早期客户AI编程助手Cursor使用其API后,每月成本从200万美元买服务器降至15万美元,推理速度加快3倍 [9] - 公司专注于满足中小企业"小而精"的定制化需求,例如帮助银行调整信用评估模型以符合合规要求,或帮助药厂做分子模拟以适配特殊实验数据 [12] - 公司70%的客户是英伟达云服务覆盖不到的中小企业,其优势在于提供"懂行业的微调方案" [13] 业务进展与财务表现 - 2023年11月,公司自研的FireAttention推理引擎将GPU算力利用率从行业平均的65%提升至92%,使客户AI模型推理成本直接减半 [11] - 公司在算力突破后决定将新方向转向企业模型微调,此决策使其在半年后估值冲刺40亿美元 [11] - 至2024年,公司年化营收ARR突破1亿美元,并逼近3亿美元,80%的客户在复购时追加"微调服务" [10][15] - 知名客户包括Perplexity将70%的推理业务迁移至该平台,阿里Qwen团队使用其服务将原本需要两周的模型压缩调试缩短至3天完成 [10] 竞争格局与战略合作 - 英伟达从公司A轮投资方转变为竞争对手,于2024年3月收购推理服务商Lepton并推出自己的GPU云市场 [12] - 公司采取"差异化共存"战略,通过FireAttention引擎积累的微调数据反向为英伟达提供GPU优化建议,例如联合开发针对金融模型稀疏计算需求的专用算力调度插件,使GPU处理效率再提高15% [12] - 公司认为其核心机会在于细分市场,与巨头的通用算力服务形成互补 [13]