关键词搜索

搜索文档
为什么谷歌搜不到“没有条纹的衬衫”
虎嗅· 2025-10-13 14:13
传统搜索引擎的局限性 - 传统搜索引擎如谷歌基于关键词匹配机制,无法理解复杂查询意图,例如搜索"没有条纹的衬衫"时仍会返回大量条纹衬衫结果[1][2] - 面对主观性问题如"谁是世界上最漂亮的女人",谷歌不直接解答,而是提供与关键词相关且点击率高的链接索引[13][14] - 传统搜索将定义和判断的责任留给用户,擅长处理事实类查询,但在需要深度理解和多重条件过滤的任务中效果有限[22] AI搜索工具Websets的技术原理 - Websets采用嵌入技术,将网页内容或用户查询转换为由数百个数字组成的语义指纹,通过计算语义指纹相似度进行匹配[24][25][28] - 该技术原生支持复杂逻辑理解,能分辨"有条纹"和"没有条纹"等否定语义的巨大差异[25] - Websets要求用户将模糊意图转化为机器可理解的客观筛选指令,将定义和判断的责任前置给用户[23] Websets的实用场景与能力 - Websets专为传统搜索引擎难以完成的复杂任务设计,如寻找具备特定复合经验的专业人士或筛选符合多重标准的公司实体[4] - 在餐饮连锁品牌CEO寻找公关专家的案例中,Websets返回结构化的电子表格,按条件筛选LinkedIn候选人并标注匹配程度[27][29][30] - 系统能准确识别在大型餐饮连锁集团担任高级职位的候选人,并对难验证的条件生成额外验证列,标注匹配或不明确[30][31] - 该案例中仅一人同时满足两个条件,Websets提供了满足条件的理由和24篇参考文献[32][33][34] Websets的局限性 - Websets索引了数十亿网页,但与谷歌万亿级别索引相比仍有几个数量级差距,结果可能更精确但不一定最全面[43][44] - 语义计算是资源密集型任务,其公司Exa在2021年500万美元种子轮融资中有一半用于建设首个GPU集群[45][46] - 嵌入技术存在信息损失风险,将长文压缩成固定长度数字列表的过程是有损的,擅长把握宏观主题但可能丢失具体细节[46][47][48] - 结果严重依赖特定数据源如LinkedIn,存在数据偏向性,在中国市场因依赖本土平台如脉脉而效果打折扣[40][41] 搜索行业的商业模式与演进 - 谷歌每年从关键词搜索及相关广告获得约1750亿至2000亿美元收入,约占其总收入的55%至60%[51] - 互联网时代搜索从路径式学习转变为结果式消费,过程黑箱化,商业因素如广告和SEO扭曲信息呈现[57][58][59][60] - 生成式AI将结果式消费推向极致,直接提供唯一答案,市场对效率和便利的追求优先级高于过程探究[61][62] - Websets代表搜索技术演进的另一种可能性,是为特定目的设计的重型装备,而非谷歌的替代品[49][50]