Retrieval Augmented Generation (RAG)
搜索文档
金山办公朱熠锷:从“看到”到“掌握”:AI应用进入“知识增强生成”时代|Alpha峰会
华尔街见闻· 2025-12-25 16:53
行业趋势与核心挑战 - 当前AI应用的核心挑战已从模型能力竞争转向如何高效利用企业私域数据 模型能力趋同使其难以形成垄断优势 [3] - 决定AI应用价值的关键在于将企业内大量复杂、非结构化的文档数据转化为高质量、可被模型理解的知识资产 [3] - 主流技术范式RAG面临根本局限 即“文档不等于知识”以及“语义相似不等于逻辑相关” [3][6] - 企业AI应用正从“以模型为中心”转向“以数据/知识为中心” 数据质量成为决定AI应用效果的关键 [3] 技术范式演进:从RAG到KAG - 公司提出必须推动技术范式从RAG演进到KAG 这是一次范式转移而非简单优化 [7] - KAG的核心观点之一是高质量输入才有高质量输出 知识必须先经过治理 解决冲突、补齐缺失、建立结构 [7] - KAG的另一核心是必须系统性融合多模态、多结构的知识资产 包括知识图谱、结构化标签、流程SOP等 [7] - 从RAG到Graph RAG再到KAG 是从“让大模型看到文档”到“理解文档间逻辑”再到“真正掌握企业知识资产”的升级 [10] 公司解决方案与架构 - 公司以知识增强生成为目标 帮助大模型真正“掌握”企业的知识资产 [3] - 公司设计了一个双层架构 底层是“知识治理层” 负责文档解析、知识抽取、图谱构建与质量监控 [7] - 架构上层是“知识应用层” 以多源融合检索引擎、动态排序模块、上下文工程体系为核心组件 [7] - 公司认为企业需要构建“数据湖”与“知识湖”双湖并重的新架构 系统地进行知识运营、建模和治理 [10] 具体应用场景与案例 - **知识治理**:通过自动化知识抽取与图谱构建 帮助客户发现文档库中的重复内容、逻辑冲突和知识缺失 [8] - **专业智能问答**:在融合私域文档图谱与行业法规、SOP等结构化知识后 问答系统能处理复杂的专业查询 [8] - **复杂文档智能抽取**:针对医疗报告、合同、发票中的复杂表格、复选框、手写体等进行专项优化 一家医药客户将药物不良反应报告处理时间从数小时缩短到几分钟 [8] - **专业领域智能写作**:通过两个智能体协同工作 生成格式合规、数据准确的专业报告 将撰写周期从数周大幅缩短 [9] 核心观点与战略意义 - 企业要像管理数据一样管理知识 将数据与知识转化为AI可用资产是企业从数字化迈向智能化的基石 [4] - 知识治理是AI在专业领域落地的基石 其重要性将超越算法优化本身 [4] - AI的专业化应用是一场“知识工程” 本质是将专业领域知识系统化、结构化的过程 [4] - 真正的智能不是“看到”文档而是“理解”逻辑 突破在于融合知识图谱、业务规则等多源知识 让AI能进行逻辑推理 [4]
KIOXIA AiSAQ Technology Integrated into Milvus Vector Database
Businesswire· 2025-12-17 10:05
公司技术整合与合作 - Kioxia America Inc 宣布其AiSAQ™近似最近邻搜索软件技术已集成至全球广泛采用的开源向量数据库Milvus中 起始版本为2.6.4 [1] - 此次集成旨在为开发者和企业提供一条简单实用的路径 以扩展AI应用 同时避免高昂的内存成本 [1] - 该集成扩展了Milvus内部的索引选项范围 为用户提供了另一种经济高效扩展AI检索能力的有力方式 [2][4] 技术解决的问题与价值主张 - 随着组织采用更大的AI模型并构建更复杂的检索增强生成管道 向量数据库因DRAM可扩展性限制而难以跟上RAG和推理需求的快速增长 [2] - DRAM成本已成为向量数据库处理数十亿甚至数万亿嵌入向量时的主要增长障碍 [3] - AiSAQ技术通过大幅降低DRAM需求并实现高质量向量搜索 使大规模RAG部署更易实现、更经济且更易于扩展 [2] - 通过原生集成AiSAQ Milvus现在支持SSD优化的向量索引 在保持高质量搜索性能的同时 显著降低了内存使用量 为企业提供了更具成本效益的扩展检索管道的路径 [3] 行业趋势与战略意义 - AI行业正从构建大规模基础模型转向部署可扩展、经济高效的推理解决方案以解决现实世界问题 [5] - RAG是这一转变的核心 AiSAQ的创建旨在帮助社区充分利用基于SSD的向量架构 [5] - 与Milvus的集成加强了开源生态系统 并支持开发者构建更快、更高效的AI应用 [5] - 公司持续推动AiSAQ技术向万亿向量规模迈进 [4] 技术细节与功能 - AiSAQ开源软件技术通过将所有RAG数据库元素存储在SSD上来提高向量可扩展性 [4] - 该技术提供调优选项 以优先考虑性能或高容量向量可扩展性 [4] - 该技术旨在减少生成式AI系统中的DRAM需求 并已作为开源软件发布 [9] 公司背景 - Kioxia America Inc 是Kioxia Corporation的美国子公司 后者是全球领先的闪存和固态硬盘供应商 [6] - 公司从发明闪存到如今的突破性BiCS FLASH™ 3D技术 持续开创创新的内存、SSD和软件解决方案 [6] - 其创新的3D闪存技术BiCS FLASH正在塑造包括先进智能手机、PC、汽车系统、数据中心和生成式AI系统在内的高密度应用存储的未来 [6][7]
挖掘“非结构化”数据价值的5种方法
36氪· 2025-12-09 12:06
行业核心观点 - 现代数据管理正面临根本性转变,企业过去十年仅专注于占数据总量10%的“干净”结构化数据,而忽视了占比高达90%的非结构化数据(如PDF、电子邮件、图像),这些数据被视为企业的“暗物质” [1] - 到2025/2026年,数据平台的价值将取决于其能否无缝连接SQL表与PDF等非结构化文档,仅擅长SQL的技能将变得过时,无法满足业务需求(如CEO直接查询PDF合同与SQL收入数据的关联)[1][3] - 行业未来的竞争焦点不在于SQL与NoSQL之争,而在于如何快速弥合结构化与非结构化数据之间的鸿沟 [15] 技术架构与集成挑战 - 当前根本性脱节在于缺乏原生、高性能的连接方式,无法将向量数据库的相似性搜索与关系数据库的精确逻辑(如LEFT JOIN语义)有效结合,导致精确映射PDF内容到数据库交易ID成为一场噩梦 [4] - 行业趋势是推动“人工智能函数”在数据仓库内部兴起,将逻辑模型引入数据本身,而非将数据移至向量数据库,理想架构应支持在主数据仓库中直接运行如`SELECT extract_contract_value(pdf_blob) FROM documents`的SQL推理查询 [4] - 专家建议停止构建独立的非结构化数据平台,寻求能在数据仓库内进行SQL推理的架构,否则应考虑迁移 [4] 成本管理与模型优化 - 处理非结构化数据的成本问题凸显,“代币税”成为新的云账单冲击,盲目使用多模态大模型(如GPT-4o、Gemini 3 Pro)进行数字化提取将造成巨大经济损失 [5] - 统计数据显示,若不进行优化,处理1 PB的非结构化文本以进行检索增强生成(RAG)可能产生高达15万美元的API费用 [6] - 解决方案是采用“模型路由”策略,使用廉价的小型语言模型(SLM)或专用模型(如BERT)完成90%的提取工作(OCR、分类、实体提取),仅在复杂推理任务时调用昂贵的大模型,以显著优化成本 [6] 数据质量与解析瓶颈 - 非结构化数据处理的主要瓶颈往往在于数据解析而非模型本身,低质量的PDF解析器(如打乱文本、合并列、忽略脚注)会导致“输入垃圾,输出幻觉”,使RAG管道失败 [8] - 行业发展趋势是从启发式解析器(如PyPDF2)转向基于视觉语言模型的多模态解析器,通过“查看”文档截图理解布局后再读取文本,以提升解析质量 [8] - 专家建议大力投资数据摄取层,认为更好的解析器带来的投资回报率比更好的大语言模型高出10倍 [9] 数据治理与检索策略 - 在监管严格行业,仅依赖概率性的向量搜索存在风险,需引入确定性的元数据作为锚点以保障数据可用性与合规性 [10] - 最成功的数据团队会在文本嵌入向量存储前,使用代理程序为其添加结构化属性(如客户ID、日期、地区)作为元数据 [10] - 专家建议检索策略切勿仅依赖语义搜索,而应采用混合搜索,即结合向量相似性与SQL过滤,并确保每条非结构化数据都包含至少3-5个结构化元数据字段 [11] 数据资产化与平台演进 - 非结构化文档(如PDF合同)正从“数据块”转变为“数据产品”容器,内含义务清单、付款计划等可查询数据资产,数据工程师的工作是将其分解为可用资产 [12] - 行业正朝着“通用数据湖”迈进,得益于Apache Iceberg等开放格式,图像、视频、文本得以与表格并存,并由单一目录统一管理 [12] - 专家建议审核数据目录,确保搜索“第三季度财务数据”等查询能返回PDF报告而不仅仅是表格,以验证目录对非结构化数据的支持能力 [13]
Coveo Introduces RAG-as-a-Service for AWS Agentic AI Services
Prnewswire· 2025-12-01 21:05
公司新产品发布 - Coveo公司宣布推出全新的云端原生服务“检索增强生成即服务”,该服务通过其托管的MCP服务器与AWS智能体AI服务集成,旨在为企业生成式AI带来更高的精确性、安全性和可扩展性 [1] - 此项新服务建立在公司十年“搜索即服务”经验之上,使组织能够利用新的Coveo托管MCP服务器,将其组织知识无缝地嵌入到AWS智能体AI服务中,包括Amazon Bedrock AgentCore、Amazon Bedrock Agents和Amazon Quick Suite [2] 产品价值与市场定位 - 公司高管指出,大型语言模型的价值取决于其相关性,即能否将回答建立在事实性、安全性和权限感知的数据基础上,而新推出的RAG即服务旨在让开发者和企业能够更快地创新,并将复杂的检索工作交给公司处理 [3] - 行业合作伙伴Perficient的实践总监认为,该服务将AWS智能体AI服务与企业级检索能力连接起来,通过结合Coveo成熟的相关性平台和Amazon Bedrock提供的模型,企业能够以前所未有的速度部署安全、有依据且高性能的生成式AI应用 [3] 产品功能与特性 - 新的Coveo RAG即服务通过一套在完全托管的MCP服务器中可配置的工具提供,其功能包括:段落检索、答案生成、搜索和文档获取 [3][7] - 具体而言,段落检索功能返回最相关的企业知识片段以支撑LLM提示;答案生成功能利用Amazon Nova从组织自身数据中生成精确答案;搜索功能提供排序的搜索结果以供上下文参考和探索;获取功能则为复杂推理任务和深度研究提供完整的文档文本 [7] 市场活动与推广 - 公司在AWS re:Invent大会上展示了其具备权限感知能力的RAG即服务与Coveo托管MCP服务器,该组合支持对Amazon Bedrock AgentCore和Amazon Quick Suite进行安全、可扩展的“ grounding” [3] - 公司将向希望加速其生成式AI或AI智能体项目的开发者提供仅限邀请的早期访问,该服务提供了一个企业就绪的基础,能够实现安全的AI相关性并与AWS智能体AI服务集成 [3] 公司战略与愿景 - Coveo公司的使命是为每一个体验触点带来卓越的AI相关性,改变企业与客户和员工的连接方式,以最大化商业成果 [3] - 公司认为,相关性意味着从面向群体到面向个人,其标准在于向个人在线呈现的全企业范围内容、产品、推荐和建议,在多大程度上与其背景、需求、偏好、行为和意图轻松匹配,这设定了竞争性体验的黄金标准,而只有AI能够解决为海量、多样化受众以及大量不同内容和产品定制体验的复杂性 [4]
Elastic(ESTC) - 2025 Q4 - Earnings Call Transcript
2025-05-30 06:02
财务数据和关键指标变化 - 第四季度总营收3.88亿美元,同比增长16%,订阅收入3.62亿美元,同比增长16%(按报告)和17%(按固定汇率),Elastic Cloud收入增长23%,非GAAP运营利润率达15% [9][30] - 2025财年,剔除月度云收入后的订阅收入为11.95亿美元,同比增长20%(按报告)和21%(按固定汇率),第四季度该指标为3.15亿美元,同比增长19% [32] - 第四季度当前剩余履约义务(CRPO)约10亿美元,同比增长18%(按报告)和17%(按固定汇率) [33] - 2025财年调整后自由现金流利润率增长约600个基点,达到19% [36] - 预计2026财年第一季度总营收在3.96 - 3.98亿美元之间,非GAAP运营利润率约为11.5%,非GAAP摊薄每股收益在0.41 - 0.43美元之间 [41] - 预计2026财年总营收在16.55 - 16.7亿美元之间,非GAAP运营利润率约为16%,非GAAP摊薄每股收益在2.24 - 2.32美元之间 [42] 各条业务线数据和关键指标变化 - 云业务在第四季度超过订阅收入的50%,增长强劲,有超2000个Elastic Cloud客户将其用于生成式AI用例,其中超310个客户年支出超10万美元 [12][18] - 自管理业务也有很强的AI吸引力,宣布与NVIDIA AI工厂集成,将成为企业在自有基础设施上构建和部署AI应用的推荐向量数据库 [19] - 安全业务方面,Attack Discovery已向客户全面推出,AI助手的活跃用户在2025财年稳步增长 [20] 各个市场数据和关键指标变化 - 各地区业务执行良好,亚太地区增长最快,其次是欧洲、中东和非洲地区以及美洲地区,但美国公共部门面临压力,导致销售周期延长 [34] 公司战略和发展方向和行业竞争 - 继续推动销售主导的市场策略,聚焦企业和高潜力中端市场客户,通过区域和细分市场的调整,已取得显著成效 [70] - 持续创新,开发高度差异化的解决方案,在安全和可观测性领域从竞争对手处获得大量前瞻性销售机会 [18] - 加强与合作伙伴的合作,与AWS达成新的五年战略合作协议,与Google的合作也不断深化,在Google Cloud Next上获得两项AI类别奖项 [25][26] - 云业务和自管理业务并重,满足不同客户需求,同时在AI领域持续发力,提升产品竞争力 [18][19] 管理层对经营环境和未来前景的评论 - 尽管宏观环境动态变化,但公司管道健康,业务模式激励客户将更多数据迁移至Elastic,预计2026财年将继续增长并保持强劲利润率 [17] - 公司在生成式AI领域处于领先地位,随着技术的发展,将继续受益于AI的广泛应用,有望成为一家具有世代影响力的公司 [28] 其他重要信息 - 公司将参加6月5日的美国银行技术会议和6月11日的Rosenblatt虚拟AI会议,并将于10月9日在纽约市举办金融分析师日活动 [6] - 2026年预计月度云收入大致持平,本季度该收入约占总收入的12% [90] 问答环节所有提问和回答 问题: 公司的指导是否比过去更保守,以及当前业务的更好领先指标是什么 - 公司在动态宏观环境下采取谨慎态度,平衡了积极的需求信号和宏观不确定性,指导中考虑了美国公共部门压力对整体业务的影响以及Q2 - Q4可能的消费逆风 [47][48] - 最佳业务衡量指标仍是收入,销售团队表现的最佳指标是剔除月度云收入后的订阅收入,CRPO也是有用的指标,显示了该指标的积极势头和未来覆盖情况 [50][51] 问题: 公司一系列合作伙伴关系带来的机会,以及与AWS合作的市场推广方面 - 公司正成为超大规模云服务提供商第三方向量数据库服务的首选,与NVIDIA的合作不仅限于云,还将覆盖企业自有数据中心环境 [54][55] - 超大规模云服务提供商的市场是公司开展业务的理想场所,公司与合作伙伴通过激励计划等合作,推动客户采用Elastic Cloud [56] 问题: 检索增强生成(RAG)架构的客户采用情况以及公司在其中的定位 - RAG被认为是始终合理的解决方案,公司的向量数据库在各种RAG用例中得到广泛应用,预计将在云和自管理业务中持续受益 [60][61] 问题: 本季度云业务环比增长较小的原因 - 第四季度有三天较少,对消费产生逆风,正常化天数后云增长率处于20%中段,较为健康,且云业务规模增大后出现了季节性模式,Q1通常是环比增长较低的季度 [64][65] 问题: 上一财年市场策略变革的重活是否完成,以及2026财年的下一步计划和企业客户策略 - 上一财年的区域变革已完全稳定并开始产生显著效果,2026财年不计划进行重大变革,但会继续招聘销售团队并进行适度调整,同时新增安全销售专家团队 [70][72][73] 问题: 不同业务板块对收入的贡献变化,以及月度云业务的未来建模 - 月度云业务是自助服务驱动,主要面向中小企业客户,公司重点推动销售主导的企业和高潜力中端市场客户业务 [83][84] - 随着AI应用的发展,搜索业务预计将在收入中占比增加,但AI将使公司所有业务受益,2026年预计月度云收入大致持平 [88][90] 问题: 关于100万美元客户的AI承诺情况以及新兴用例 - 25%的100万美元客户正在使用公司的AI工作负载,反映了该高增长潜力客户群体的采用情况 [94] - 新兴用例涵盖销售、营销自动化、法律电子发现、与合作伙伴的对话应用等多个领域,客户正从语义搜索用例扩展到构建自动化代理以实现工作流程自动化 [96][97] 问题: 美国公共部门业务压力的具体表现和量化情况 - 公司业务多元化,美国公共部门是重要垂直领域之一,但其他地区表现良好,弥补了该部门的压力,难以量化公共部门业务压力的具体影响 [101][102] - 公司谨慎地将美国公共部门压力外推至全年业务,这是收入指导范围的最大影响因素 [113] 问题: 第四季度云增长未加速的原因及各业务板块的贡献情况 - AI需求不仅体现在云业务,自管理业务也有良好表现,消费情况稳定,公司预计云和自管理业务将继续推动增长 [108][109][110] 问题: 上一财年市场细分变革的主要收获、意外情况以及未来市场策略的调整 - 公司专注于销售主导的企业和高潜力中端市场客户业务,上一财年的变革已见成效,目前需要继续扩大销售团队规模,同时加强安全业务的专业化,以抓住市场机会 [119][120][122] 问题: 100万美元和10万美元客户对公司整体产品组合的使用情况 - 公司未细分该数据,将在10月的金融分析师日活动中提供详细信息,但大型客户通常会使用公司平台的多种功能,土地扩张策略效果良好 [131][132][133] 问题: 4月到5月业务线性度在垂直领域或客户规模方面是否存在差异 - 公司垂直领域多元化,4月到5月在业务线性度上没有明显差异,目前宏观情况与Q4类似,除美国公共部门外无新增消费压力 [134] 问题: 目前销售团队的生产力情况以及与管道的关系 - 2025财年销售团队的生产力令人满意,年初的变革在Q1带来一些问题,但Q4开始显现成效,公司内部使用AI提高销售团队的目标定位和客户沟通效率 [138]