Retrieval Augmented Generation (RAG)
搜索文档
KIOXIA AiSAQ Technology Integrated into Milvus Vector Database
Businesswire· 2025-12-17 10:05
SAN JOSE, Calif.--(BUSINESS WIRE)--Kioxia America, Inc. today announced that its AiSAQâ"¢ approximate nearest neighbor search (ANNS) software technology has been integrated into Milvus (starting with version 2.6.4), among the world's most widely adopted open-source vector databases, created by Zilliz. This integration with Milvus gives developers and enterprises an easy, practical path to scaling AI applications without facing prohibitive memory costs. KIOXIA's AiSAQ integration expands the range of indexin ...
挖掘“非结构化”数据价值的5种方法
36氪· 2025-12-09 12:06
行业核心观点 - 现代数据管理正面临根本性转变,企业过去十年仅专注于占数据总量10%的“干净”结构化数据,而忽视了占比高达90%的非结构化数据(如PDF、电子邮件、图像),这些数据被视为企业的“暗物质” [1] - 到2025/2026年,数据平台的价值将取决于其能否无缝连接SQL表与PDF等非结构化文档,仅擅长SQL的技能将变得过时,无法满足业务需求(如CEO直接查询PDF合同与SQL收入数据的关联)[1][3] - 行业未来的竞争焦点不在于SQL与NoSQL之争,而在于如何快速弥合结构化与非结构化数据之间的鸿沟 [15] 技术架构与集成挑战 - 当前根本性脱节在于缺乏原生、高性能的连接方式,无法将向量数据库的相似性搜索与关系数据库的精确逻辑(如LEFT JOIN语义)有效结合,导致精确映射PDF内容到数据库交易ID成为一场噩梦 [4] - 行业趋势是推动“人工智能函数”在数据仓库内部兴起,将逻辑模型引入数据本身,而非将数据移至向量数据库,理想架构应支持在主数据仓库中直接运行如`SELECT extract_contract_value(pdf_blob) FROM documents`的SQL推理查询 [4] - 专家建议停止构建独立的非结构化数据平台,寻求能在数据仓库内进行SQL推理的架构,否则应考虑迁移 [4] 成本管理与模型优化 - 处理非结构化数据的成本问题凸显,“代币税”成为新的云账单冲击,盲目使用多模态大模型(如GPT-4o、Gemini 3 Pro)进行数字化提取将造成巨大经济损失 [5] - 统计数据显示,若不进行优化,处理1 PB的非结构化文本以进行检索增强生成(RAG)可能产生高达15万美元的API费用 [6] - 解决方案是采用“模型路由”策略,使用廉价的小型语言模型(SLM)或专用模型(如BERT)完成90%的提取工作(OCR、分类、实体提取),仅在复杂推理任务时调用昂贵的大模型,以显著优化成本 [6] 数据质量与解析瓶颈 - 非结构化数据处理的主要瓶颈往往在于数据解析而非模型本身,低质量的PDF解析器(如打乱文本、合并列、忽略脚注)会导致“输入垃圾,输出幻觉”,使RAG管道失败 [8] - 行业发展趋势是从启发式解析器(如PyPDF2)转向基于视觉语言模型的多模态解析器,通过“查看”文档截图理解布局后再读取文本,以提升解析质量 [8] - 专家建议大力投资数据摄取层,认为更好的解析器带来的投资回报率比更好的大语言模型高出10倍 [9] 数据治理与检索策略 - 在监管严格行业,仅依赖概率性的向量搜索存在风险,需引入确定性的元数据作为锚点以保障数据可用性与合规性 [10] - 最成功的数据团队会在文本嵌入向量存储前,使用代理程序为其添加结构化属性(如客户ID、日期、地区)作为元数据 [10] - 专家建议检索策略切勿仅依赖语义搜索,而应采用混合搜索,即结合向量相似性与SQL过滤,并确保每条非结构化数据都包含至少3-5个结构化元数据字段 [11] 数据资产化与平台演进 - 非结构化文档(如PDF合同)正从“数据块”转变为“数据产品”容器,内含义务清单、付款计划等可查询数据资产,数据工程师的工作是将其分解为可用资产 [12] - 行业正朝着“通用数据湖”迈进,得益于Apache Iceberg等开放格式,图像、视频、文本得以与表格并存,并由单一目录统一管理 [12] - 专家建议审核数据目录,确保搜索“第三季度财务数据”等查询能返回PDF报告而不仅仅是表格,以验证目录对非结构化数据的支持能力 [13]
Coveo Introduces RAG-as-a-Service for AWS Agentic AI Services
Prnewswire· 2025-12-01 21:05
Accessibility StatementSkip Navigation Enterprise-ready foundation integrates with AWS agentic AI services through a Coveo-hosted MCP Server, helping ensure every agentic response is factual, contextual, and compliant MONTREAL, Dec. 1, 2025 /PRNewswire/ -Â Coveo, the leader in AI-Relevance, delivering best-in-class AI- search and generative experiences, today announced Retrieval Augmented Generation (RAG)-as-a-Service for AWS agentic AI services through a Coveo-hosted MCP Server, a new cloud-native offering ...
Elastic(ESTC) - 2025 Q4 - Earnings Call Transcript
2025-05-30 06:02
财务数据和关键指标变化 - 第四季度总营收3.88亿美元,同比增长16%,订阅收入3.62亿美元,同比增长16%(按报告)和17%(按固定汇率),Elastic Cloud收入增长23%,非GAAP运营利润率达15% [9][30] - 2025财年,剔除月度云收入后的订阅收入为11.95亿美元,同比增长20%(按报告)和21%(按固定汇率),第四季度该指标为3.15亿美元,同比增长19% [32] - 第四季度当前剩余履约义务(CRPO)约10亿美元,同比增长18%(按报告)和17%(按固定汇率) [33] - 2025财年调整后自由现金流利润率增长约600个基点,达到19% [36] - 预计2026财年第一季度总营收在3.96 - 3.98亿美元之间,非GAAP运营利润率约为11.5%,非GAAP摊薄每股收益在0.41 - 0.43美元之间 [41] - 预计2026财年总营收在16.55 - 16.7亿美元之间,非GAAP运营利润率约为16%,非GAAP摊薄每股收益在2.24 - 2.32美元之间 [42] 各条业务线数据和关键指标变化 - 云业务在第四季度超过订阅收入的50%,增长强劲,有超2000个Elastic Cloud客户将其用于生成式AI用例,其中超310个客户年支出超10万美元 [12][18] - 自管理业务也有很强的AI吸引力,宣布与NVIDIA AI工厂集成,将成为企业在自有基础设施上构建和部署AI应用的推荐向量数据库 [19] - 安全业务方面,Attack Discovery已向客户全面推出,AI助手的活跃用户在2025财年稳步增长 [20] 各个市场数据和关键指标变化 - 各地区业务执行良好,亚太地区增长最快,其次是欧洲、中东和非洲地区以及美洲地区,但美国公共部门面临压力,导致销售周期延长 [34] 公司战略和发展方向和行业竞争 - 继续推动销售主导的市场策略,聚焦企业和高潜力中端市场客户,通过区域和细分市场的调整,已取得显著成效 [70] - 持续创新,开发高度差异化的解决方案,在安全和可观测性领域从竞争对手处获得大量前瞻性销售机会 [18] - 加强与合作伙伴的合作,与AWS达成新的五年战略合作协议,与Google的合作也不断深化,在Google Cloud Next上获得两项AI类别奖项 [25][26] - 云业务和自管理业务并重,满足不同客户需求,同时在AI领域持续发力,提升产品竞争力 [18][19] 管理层对经营环境和未来前景的评论 - 尽管宏观环境动态变化,但公司管道健康,业务模式激励客户将更多数据迁移至Elastic,预计2026财年将继续增长并保持强劲利润率 [17] - 公司在生成式AI领域处于领先地位,随着技术的发展,将继续受益于AI的广泛应用,有望成为一家具有世代影响力的公司 [28] 其他重要信息 - 公司将参加6月5日的美国银行技术会议和6月11日的Rosenblatt虚拟AI会议,并将于10月9日在纽约市举办金融分析师日活动 [6] - 2026年预计月度云收入大致持平,本季度该收入约占总收入的12% [90] 问答环节所有提问和回答 问题: 公司的指导是否比过去更保守,以及当前业务的更好领先指标是什么 - 公司在动态宏观环境下采取谨慎态度,平衡了积极的需求信号和宏观不确定性,指导中考虑了美国公共部门压力对整体业务的影响以及Q2 - Q4可能的消费逆风 [47][48] - 最佳业务衡量指标仍是收入,销售团队表现的最佳指标是剔除月度云收入后的订阅收入,CRPO也是有用的指标,显示了该指标的积极势头和未来覆盖情况 [50][51] 问题: 公司一系列合作伙伴关系带来的机会,以及与AWS合作的市场推广方面 - 公司正成为超大规模云服务提供商第三方向量数据库服务的首选,与NVIDIA的合作不仅限于云,还将覆盖企业自有数据中心环境 [54][55] - 超大规模云服务提供商的市场是公司开展业务的理想场所,公司与合作伙伴通过激励计划等合作,推动客户采用Elastic Cloud [56] 问题: 检索增强生成(RAG)架构的客户采用情况以及公司在其中的定位 - RAG被认为是始终合理的解决方案,公司的向量数据库在各种RAG用例中得到广泛应用,预计将在云和自管理业务中持续受益 [60][61] 问题: 本季度云业务环比增长较小的原因 - 第四季度有三天较少,对消费产生逆风,正常化天数后云增长率处于20%中段,较为健康,且云业务规模增大后出现了季节性模式,Q1通常是环比增长较低的季度 [64][65] 问题: 上一财年市场策略变革的重活是否完成,以及2026财年的下一步计划和企业客户策略 - 上一财年的区域变革已完全稳定并开始产生显著效果,2026财年不计划进行重大变革,但会继续招聘销售团队并进行适度调整,同时新增安全销售专家团队 [70][72][73] 问题: 不同业务板块对收入的贡献变化,以及月度云业务的未来建模 - 月度云业务是自助服务驱动,主要面向中小企业客户,公司重点推动销售主导的企业和高潜力中端市场客户业务 [83][84] - 随着AI应用的发展,搜索业务预计将在收入中占比增加,但AI将使公司所有业务受益,2026年预计月度云收入大致持平 [88][90] 问题: 关于100万美元客户的AI承诺情况以及新兴用例 - 25%的100万美元客户正在使用公司的AI工作负载,反映了该高增长潜力客户群体的采用情况 [94] - 新兴用例涵盖销售、营销自动化、法律电子发现、与合作伙伴的对话应用等多个领域,客户正从语义搜索用例扩展到构建自动化代理以实现工作流程自动化 [96][97] 问题: 美国公共部门业务压力的具体表现和量化情况 - 公司业务多元化,美国公共部门是重要垂直领域之一,但其他地区表现良好,弥补了该部门的压力,难以量化公共部门业务压力的具体影响 [101][102] - 公司谨慎地将美国公共部门压力外推至全年业务,这是收入指导范围的最大影响因素 [113] 问题: 第四季度云增长未加速的原因及各业务板块的贡献情况 - AI需求不仅体现在云业务,自管理业务也有良好表现,消费情况稳定,公司预计云和自管理业务将继续推动增长 [108][109][110] 问题: 上一财年市场细分变革的主要收获、意外情况以及未来市场策略的调整 - 公司专注于销售主导的企业和高潜力中端市场客户业务,上一财年的变革已见成效,目前需要继续扩大销售团队规模,同时加强安全业务的专业化,以抓住市场机会 [119][120][122] 问题: 100万美元和10万美元客户对公司整体产品组合的使用情况 - 公司未细分该数据,将在10月的金融分析师日活动中提供详细信息,但大型客户通常会使用公司平台的多种功能,土地扩张策略效果良好 [131][132][133] 问题: 4月到5月业务线性度在垂直领域或客户规模方面是否存在差异 - 公司垂直领域多元化,4月到5月在业务线性度上没有明显差异,目前宏观情况与Q4类似,除美国公共部门外无新增消费压力 [134] 问题: 目前销售团队的生产力情况以及与管道的关系 - 2025财年销售团队的生产力令人满意,年初的变革在Q1带来一些问题,但Q4开始显现成效,公司内部使用AI提高销售团队的目标定位和客户沟通效率 [138]