Workflow
Exa:给 AI Agent 的 “Bing API”
海外独角兽·2025-04-07 20:09

Agentic AI与搜索基础设施 - Agentic AI的三大要素是工具使用(tool use)、记忆(memory)和上下文(context),围绕这些场景将出现原生Agent基础设施机会 [2] - AI Agent将成为网页信息搜索的主力用户,需要不同于人类的全新搜索基础设施 [6][7] - 现有搜索引擎主要服务于人类快速查询,无法满足AI Agent对复杂查询、丰富上下文和高吞吐的需求 [9] 搜索行为分类 - 高频快速查询:Google/Bing仍占优势,新玩家机会有限 [6] - 研究性质深入查询:LLM/LRM带来的新场景,代表产品为Chatbot和Deep research [6] - 个人偏好查询:大模型可处理更复杂语义查询,但面临长记忆能力不足等挑战 [6] - 长尾查询:覆盖用户小众兴趣领域 [6] - AI在第二、三类场景最具挑战传统搜索的潜力 [6] Exa公司概况 - 定位为LLM时代的"Bing API",为AI重新设计搜索系统 [13] - 主要产品包括面向开发者的API和面向专业用户的Websets [13][20] - 技术衍生自端到端神经网络和Transformer架构,将next token prediction改进为next link prediction [59] - 核心差异化:用户可通过投入更多计算资源获得更全面的搜索结果 [3][61] Exa API能力 - Search API:支持自然语言输入的语义搜索,可定制输出格式 [14] - Get Contents API:爬取多个网页内容 [14] - Answer API:对搜索结果进行智能问答 [14] - Find Similar Links API:返回内容相似的网站 [14] - 性能指标:延迟300ms,每秒处理100+查询,支持数千结果返回 [15] Websets产品 - 通过语义搜索生成完整信息列表,类似通用版Clay [22][23] - 支持任意类别搜索和自然语言筛选,准确性是核心卖点 [23] - 在内部测试中比Google和OpenAI Deep research多发现10倍正确结果 [24] - Pro版定价800美元/月,是OpenAI Deep research的4倍 [29] 使用场景 - 投资研究:辅助搜集初创公司信息 [32] - 超级写作补全:自动补全并附参考 [41] - Twitter分析:跨平台搜索分析能力 [44] - 学术论文搜索:可视化展示论文索引和分类 [48][49] 技术架构 - 选择性对互联网部分内容构建索引,采用"二八效应"策略 [54][57] - 基于Transformer架构改进模型,实现预测最相关网页 [59] - 部署基于NVIDIA H200 GPU的AI集群 [61] - 团队规模小但能力强,每个技术环节由1-2人负责 [65] 市场竞争 - 不与Google直接竞争,专注Google无法完成的复杂查询 [66] - 作为LLM补充工具,定位连接LLM智能与互联网知识 [75] - 相比Deep research产品更专注搜索相关性 [78] - 潜在竞争对手包括Brave Software等Agent基础设施提供商 [78] 融资与经营 - 2021年成立,先后完成种子轮和2200万美元A轮融资 [78] - A轮由Lightspeed领投,英伟达等跟投 [78] - 主要收入来自API销售,用户数量数千家 [79] - 收入在过去几个月增长3倍,ARR估算至少960万美元 [79]