Agent 如何用搜索?这家最懂 AI 搜索的团队,把踩过的坑都分享出来了
Founder Park·2025-11-17 18:08

AI时代搜索的根本性变革 - AI搜索是动态、流式、可追问的过程,一个复杂任务可能引发多轮、数十次检索,与传统人类"一次性"静态检索截然不同[4][6] - AI搜索需求呈现三大变化:需要多语言内容索引构建、权威性重要性大幅提升、需要更完整的长摘要内容返回而非短摘要[6][7] - 评价标准从人类搜索的"黄金前三条"点击率转向AI搜索的"全员及格线",要求前10条甚至前50条结果整体质量高,覆盖全面且无虚假内容[8][9] - 搜索能够有效解决大模型的幻觉问题和数据时效性局限,成为AI应用必备能力[4][6][11] 小宿科技的业务定位与市场前景 - 公司定位为AI Agent基础设施提供商,主要业务包括智能搜索和内容读取两大块,服务国内超过一半头部AI原生应用[1][10][11] - 智能搜索基于自研搜索引擎,拥有千亿规模数据索引库,通过语义理解和召回排序技术为AI提供优化结果[12] - 内容读取功能像"AI时代的浏览器",能深度解析网页并将内容转化为干净格式如Markdown或纯文本[12] - 预计Token消耗量将以十倍、百倍甚至千倍速度增长,AI替代人类重复劳动比例将从当前0.01%大幅提升[11][41] 不同AI应用场景的搜索解决方案 - 办公类Agent需将复杂指令拆解成多个关键词,进行关系分析和结果聚合,而非简单将全部prompt丢给搜索[15][16][17] - 通用AI Agent需要一次性获得50条包含长摘要的结果,保证数据格式适配性,满足深度研究需求[12][20] - 金融、学术等垂直行业需解决公开数据质量参差不齐问题,通过站点指定和垂类搜索优化保证内容权威性[23][24] - AI硬件产品需平衡成本与响应速度,采用动态摘要技术和系统优化实现毫秒级响应,控制token消耗[28] 搜索技术路线与质量把控 - 在多数场景下搜索准确性比速度更重要,向量检索入手门槛低但上限有限,语义理解对多义理解和消歧更关键[4][29][30] - 通过算法能力保证时效性,如通过站点特征发现高热hub页,监测机制发现热点线索,而非简单高频监测[31] - 数据清洗采用自动化为主的方式,基于低质关键词、数据源、向量相似度等多维度提高数据纯度,必要时结合人工审核[39] - 针对AI生成内容污染问题,通过黑名单、白名单等机制剔除低质信息,保证给模型的结果真实有效[42][43] 竞争优势与行业洞察 - 与国内外竞品相比优势在于多语种支持、内容质量头部水平、性价比更高,有客户将90%搜索流量从Tavily切换过来[34] - 模型成本远高于搜索成本,多搜索几次来提升内容质量比减少搜索次数更经济[4][35] - 搜索未来将作为Agent的重要工具,随着Agent渗透率从当前十万级日活提升,搜索需求将同步增长[41] - 推荐良性GEO策略,通过提供高质量内容获得曝光,而非采用黑帽手段污染生态[44][45]