Workflow
Eval Protocol
icon
搜索文档
288亿独角兽!复旦女学霸创业3年,被黄仁勋和苏妈同时押注
深思SenseAI· 2025-10-30 09:04
公司概况与市场地位 - 公司是AI推理服务提供商与推理层基础设施平台,定位为让模型运行更快、更便宜、更稳定,把推理变成类似云计算的计量服务 [5] - 成立3年时间,年收入已达2.8亿美元,公司估值达40亿美元,是AI推理赛道增长最快的独角兽 [1] - 目前已服务超过10,000家企业客户,每天处理超10万亿tokens,客户包括Cursor、Notion、Uber、Samsung、Shopify等明星产品 [1][5] 融资情况 - 2025年10月28日,公司宣布完成2.54亿美元C轮融资 [1] - 本轮融资由Lightspeed、Index Ventures和Evantic领投,英伟达、AMD、红杉资本、Databricks等知名机构跟投 [1][5] 创始团队与技术渊源 - 创始人乔琳是PyTorch框架的核心创建者,职业生涯始于IBM研究,后在LinkedIn担任技术主管,在Meta担任AI平台架构关键负责人,领导超300人工程师团队 [3][5] - 创始团队由六位参与过Meta PyTorch项目的资深工程师与一位前谷歌AI专家组成,堪称“梦之队” [6] - 公司核心洞察是“训练是科研的浪漫,推理才是产业的现金流”,创新焦点从“构建”转向“应用” [1][8] 核心产品与服务 - 第一类产品是Serverless推理云,面向开发者提供“即开即用”的API,按token计费,兼容数百个开源与私有模型 [11] - 第二类产品是专属部署方案,针对金融、医疗等高合规行业,提供独立GPU资源和专用网络隔离,按GPU秒计费 [11] - 第三类产品是微调与评测服务,提供从数据治理、训练微调到在线评测的一体化能力,按训练token计费 [12] 技术优势与性能表现 - 自研的Fire Attention推理引擎与Fire Optimizer可在硬件与算法之间自动搜索超过十万种配置组合,使推理速度提升10–40倍、成本下降数十个百分点 [12] - 以客户Cursor为例,在公司的推测解码技术支持下,模型处理代码的速度提升13倍,从“等半天”变成“几秒钟” [14] - 技术底座建立在深度GPU优化与架构级创新上,把延迟、吞吐、成本这些工程参数转化成企业可以签约的服务条款 [9][12] 市场竞争与差异化 - 直接竞争对手包括Together AI、Replicate、Groq、Baseten Labs等初创公司,以及AWS、Google Cloud、Azure等云巨头 [15] - 差异化优势不是“最快”或“最便宜”,而是“最优化”和“最易用”,支持数百个开源模型,跨多云多区域运行 [16] - 护城河是“客户数据+定制化能力”的飞轮,每个客户的微调数据都在优化系统,越用越好 [16] 行业趋势与未来战略 - 生成式AI带来的范式转移让创新焦点从“构建”转向“应用”,推理的市场规模将远超训练 [8] - 公司预测2025年将成为“Agent年”和“开源模型年”,各行业将涌现大量解决垂直问题的AI智能体 [20] - 未来核心战略是强化Fire Optimizer系统,特别强化在推理质量上的能力,通过个性化定制提升模型效果 [20] - 终极愿景是让每个开发者都能定制模型、注入数据,全面提升推理能力,让AI控制权回到构建者手中 [21][22]