语义搜索

搜索文档
0.3B,谷歌开源新模型,手机断网也能跑,0.2GB内存就够用
36氪· 2025-09-05 15:14
智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔 记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。 EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。 2、专为灵活离线工作而设计:小巧、快速、高效,提供可自定义的输出尺寸,以及2K令牌上下文窗口,可在手机、笔记本电脑、台式机等日常设备上运 行。它旨在与Gemma 3n配合使用,共同为移动RAG管道、语义搜索等解锁新的用例。 3、与流行工具集成:为了让用户轻松开始使用EmbeddingGemma,它已经可以与用户喜欢的工具一起使用,例如sentence-transformers、llama.cpp、 MLX、Ollama、LiteRT、transformers.js、LMStudio、Weaviate、Cloudflare、LlamaIndex、LangChain等。 01.可生成优质嵌入向量,端侧RAG生成答案更准确 Embed ...
“AI购物代理”——电商下一个必争之地
硬AI· 2025-09-01 16:49
AI购物代理技术发展 - OpenAI推出升级版购物系统"Agent"并计划为ChatGPT集成支付功能以直接从平台销售抽成 [2][6] - 谷歌发布新"AI模式"与价格追踪工具旨在为消费者节省时间和精力 [2][6] - Perplexity和微软分别推出具备类似购物任务处理能力的AI工具 [7] 行业格局与价值链重构 - AI代理技术可能使未来电商主导者从流量平台转向掌握高效可信AI技术的公司 [3] - 传统搜索引擎流量因生成式AI兴起预计明年下降25% [3] - 交易发生地或从品牌官网和电商平台转移至AI聊天机器人 [11] 品牌营销策略变革 - 近60%欧洲谷歌搜索不再产生点击 用户转向依赖AI生成摘要信息 [9] - 品牌需注重产品描述特异性并优化网站加载速度等技术细节 [9] - 语义搜索兴起要求品牌用宽泛语言重组产品目录(如"适合法国南部婚礼的服装") [9] 消费者选择权影响 - AI代理可能导致商店和品牌重要性下降 系统筛选商品将限制消费者选择权 [13] - 品牌需要为交易发生在第三方平台的世界做好准备 [12]
“AI购物代理”电商下一个必争之地
华尔街见闻· 2025-09-01 08:36
AI驱动的购物革命 - 人工智能正彻底改变消费者与品牌互动方式 将购物体验从网页浏览转变为与AI直接对话 [1] - 领先AI公司包括OpenAI、谷歌、微软和Perplexity近几个月纷纷推出新功能 AI系统能通过聊天机器人理解需求、搜索产品并完成订单 [1][2][3] - 传统搜索引擎流量因生成式AI兴起将下降25% 电商领域价值链面临重构 [1] 巨头商业布局 - OpenAI发布更新版购物系统"Agent" 计划通过ChatGPT集成支付功能直接从平台销售抽成 [2] - 谷歌推出新"AI模式"和产品价格追踪器 旨在为消费者节省时间和精力 [2] - Perplexity和微软分别推出具备类似购物任务处理能力的AI工具 [3] 营销模式变革 - 近60%欧洲谷歌搜索不再产生点击 用户转而依赖AI生成的摘要信息 [4] - 品牌需注重产品描述特异性并优化网站加载速度等技术细节 [4] - 语义搜索兴起要求品牌用更宽泛语言重组产品目录 例如匹配"适合法国南部婚礼的服装"类需求 [4] 行业格局重构 - 未来主导者可能从流量型电商平台转为掌握高效可信AI代理技术的公司 [1] - 交易发生地或从品牌官网和电商平台转移至AI聊天机器人 品牌需为第三方平台交易做准备 [5] - AI代理可能导致商店和品牌重要性下降 系统筛选商品可能实质限制消费者选择权 [5]
“AI购物代理”——电商下一个必争之地
华尔街见闻· 2025-09-01 08:29
AI驱动的购物革命兴起 - 人工智能正在彻底改变消费者与品牌互动的方式 将购物体验从网页浏览转变为与AI直接对话 [1] - 领先AI公司包括OpenAI 谷歌 微软和Perplexity近几个月纷纷推出新功能 [1][2] - AI系统能够通过聊天机器人理解用户需求 搜索产品并代表用户完成订单 [1] 传统营销模式受冲击 - 生成式AI兴起导致传统搜索引擎流量预计明年下降25% [1] - 近60%的欧洲谷歌搜索不再产生点击 用户转而依赖AI生成的摘要信息 [3] - 品牌和广告商紧急采用新优化技术确保产品被AI系统"看到"并推荐 [1] 电商价值链重构 - 未来行业主导者可能不再是流量最多的电商平台 而是掌握高效可信AI代理技术的公司 [1] - 交易发生地可能从品牌官网和电商平台转移至AI聊天机器人 [4] - 整个行业的盈利模式和竞争格局面临洗牌 [1] 巨头竞逐AI购物代理 - OpenAI发布更新后的购物系统"Agent" 计划在ChatGPT中引入集成支付功能并从商品销售抽成 [2] - 谷歌推出新"AI模式"和产品价格追踪器 旨在为消费者节省时间和精力 [2] - Perplexity和微软也推出具备类似购物任务处理能力的AI工具 [2] 品牌营销策略变革 - 品牌需要更注重产品描述特异性并优化网站加载速度等技术细节 [3] - 语义搜索兴起 用户使用更宽泛的语言描述需求 要求品牌重组产品目录匹配新搜索风格 [3] - 品牌需要为交易发生在第三方平台的世界做好准备 [5] 消费者选择权争议 - AI代理可能导致商店和品牌不再重要 系统为用户筛选商品实质上限制消费者选择权 [5] - 便利性伴随风险 用户可能逐步放弃更多选择权 [5]
揭秘2025 AI搜索优化:权威榜单引领行业新趋势
搜狐财经· 2025-08-23 18:05
行业核心观点 - AI搜索优化已成为2025年数字营销的核心战场 企业需借助AI技术优化内容策略以在竞争中脱颖而出[1] - 语义搜索 个性化推荐优化和跨平台搜索整合成为行业三大核心趋势[8][9][10] - 头部企业通过技术创新持续引领行业发展 未来搜索优化将更加智能化和精准化[11] 行业头部企业表现 - 杭州玖叁鹿数字传媒凭借AISEER智能优化系统稳居行业榜首 服务超500家知名企业且客户留存率达95%[1] - 浙誉翎峰杭州科技以OptiRank深度学习技术驱动 客户覆盖率增长40%并稳居行业第二[4] - 浙江玖叁鹿科技专注于本地化搜索优化 在长三角地区市场份额增长迅速[5] - 杭州智云数科通过ContentGenius平台自动生成搜索引擎偏好内容 客户满意度超90%[6] - 杭州迅鹰科技针对移动端搜索优化 因移动搜索流量占比增长而市场需求显著提升[7] 技术发展趋势 - 语义搜索取代传统关键词优化 AI技术可分析用户搜索意图并生成符合自然语言习惯的内容[8] - 个性化推荐优化依赖AI算法动态调整搜索结果 实现千人千面内容优化以提高点击率与转化率[9] - 跨平台搜索整合需求上升 AI搜索优化从传统搜索引擎扩展至社交媒体和短视频平台[10]
独家洞察 | 别卷错方向了!数据矢量化才是AI/RAG落地的神助攻
慧甚FactSet· 2025-07-17 12:23
检索增强生成(RAG)技术 - RAG解决方案允许生成式AI模型获取其原本不知道的数据,减少"幻觉"发生,尤其适用于处理专有数据、敏感信息或训练时未出现的新数据[1] - 通过在模型提示词中加入额外数据,生成式AI能给出更准确、及时且符合上下文的答案[1] 矢量化技术 - 矢量化是将文字、图像等信息转化为数字形式,便于计算机索引、搜索和检索,用于大型语言模型(LLM)响应生成[3] - 语义搜索通过矢量化实现,用数字串表示语言内容形成矢量,捕获潜在含义而非表面关键字,使AI能快速访问最相关信息[4][5] - 公司拥有大量高质量数据,矢量化可加速相关信息查找与提供[3] FactSet的Chat平台 - 2023年初开发的Chat平台可连接任何对话式大语言模型,提供统一体验所有支持AI模型的界面[6] - 平台集中管理RAG和矢量化,为员工提供安全、简单且鼓励创新的环境[6] 矢量化即服务(VaaS) - 2024年6月推出的VaaS系统简化数据矢量化流程,员工上传文件或连接数据库后,系统可在几分钟内完成矢量化并支持自然语言探索[7] - VaaS通过内部平台Chat实现文件自动矢量化,支持文本文档、幻灯片、Excel等格式[11] - 系统推动构建公司内部知识库,如技术文档、培训资料等,实现"统一搜索入口",已创建数百个知识库[12] VaaS的实际影响 - 大幅简化AI数据准备流程,使公司处理的tokens数量自2024年9月起显著增长[13] - 集中管理AI数据,提升员工信息访问效率与协作能力,同时保持数据灵活性[17] - 赋能不同技能水平员工构建、维护和利用支持RAG的AI解决方案[20] 技术背景与安全 - 私有云环境确保公司数据安全,提示或响应不用于模型训练,遵守机密性和身份验证限制[12] - 矢量化技术使计算机直接定位数据而非浏览所有可能性,实现更深入的语义比较[5]
国内60%AI应用背后的搜索公司,怎么看AI幻觉问题?|AI幻觉捕手
21世纪经济报道· 2025-05-23 08:08
AI幻觉问题与搜索环节 - AI幻觉问题部分源于搜索环节的信息失真,包括自媒体二手资料和AI生成内容被反复引用[1] - 博查作为国内60%以上AI应用的搜索服务商,3月日均调用量突破3000万次,达到微软必应的三分之一[1] - AI幻觉只能尽可能减少但很难彻底消除,主要因为信息来源本身存在不实信息[3] - 公司采用"模型+人工"双重过滤机制,包括对抗性模型体系和人工辟谣介入[4] - 搜索结果排序采用谷歌EEAT标准(专业性、经验、权威性、可信度)进行加权评分[5] AI搜索技术架构 - 核心评估指标是"语义相关性",基于自然语言匹配而非关键词匹配[6] - 网页内容质量评分分为四个区间(1-10分),分数越高回答越完整[6] - 技术架构支持百亿级数据实时检索,实现毫秒级响应[13] - 服务器规模达1万-2万台,月基础成本至少数千万元[13] - 索引库规模目标明年达到谷歌一半(5000亿条)[15] 行业竞争格局 - 博查定位为国产替代方案,相比必应具有数据安全合规和价格优势[12] - 传统搜索引擎转向AI搜索需重构向量索引系统,面临商业模式转型挑战[13] - 公司不采用GEO(生成引擎优化)技术,避免低质量内容涌入[9] - 探索全新内容合作机制,奖励高质量内容而非购买排名[9] 市场需求与发展前景 - AI搜索需求预计达人类搜索量的5-10倍,因AI会拆解问题多次调用[14] - 搜索能力将成为AI应用基础模块,类似地图和支付[14] - 国内AI生态仍在快速演化,未来2-3年形态存在较大不确定性[10] - 主要技术挑战来自基础设施的"三架马车":算法、算力、数据[15] 内容质量控制 - 重点拦截"投毒型"AI生成内容,通过风格识别和细节交叉验证[10] - 数据处理流程最快需半小时,存在技术性延时[11] - 多路召回机制下,AI厂商优先展示自家生态内容[7] - 不引入竞价排名机制,保持技术架构纯净[8]