行业趋势与核心挑战 - 当前AI应用的核心挑战已从模型能力竞争转向如何高效利用企业私域数据 模型能力趋同使其难以形成垄断优势 [3] - 决定AI应用价值的关键在于将企业内大量复杂、非结构化的文档数据转化为高质量、可被模型理解的知识资产 [3] - 主流技术范式RAG面临根本局限 即“文档不等于知识”以及“语义相似不等于逻辑相关” [3][6] - 企业AI应用正从“以模型为中心”转向“以数据/知识为中心” 数据质量成为决定AI应用效果的关键 [3] 技术范式演进:从RAG到KAG - 公司提出必须推动技术范式从RAG演进到KAG 这是一次范式转移而非简单优化 [7] - KAG的核心观点之一是高质量输入才有高质量输出 知识必须先经过治理 解决冲突、补齐缺失、建立结构 [7] - KAG的另一核心是必须系统性融合多模态、多结构的知识资产 包括知识图谱、结构化标签、流程SOP等 [7] - 从RAG到Graph RAG再到KAG 是从“让大模型看到文档”到“理解文档间逻辑”再到“真正掌握企业知识资产”的升级 [10] 公司解决方案与架构 - 公司以知识增强生成为目标 帮助大模型真正“掌握”企业的知识资产 [3] - 公司设计了一个双层架构 底层是“知识治理层” 负责文档解析、知识抽取、图谱构建与质量监控 [7] - 架构上层是“知识应用层” 以多源融合检索引擎、动态排序模块、上下文工程体系为核心组件 [7] - 公司认为企业需要构建“数据湖”与“知识湖”双湖并重的新架构 系统地进行知识运营、建模和治理 [10] 具体应用场景与案例 - 知识治理:通过自动化知识抽取与图谱构建 帮助客户发现文档库中的重复内容、逻辑冲突和知识缺失 [8] - 专业智能问答:在融合私域文档图谱与行业法规、SOP等结构化知识后 问答系统能处理复杂的专业查询 [8] - 复杂文档智能抽取:针对医疗报告、合同、发票中的复杂表格、复选框、手写体等进行专项优化 一家医药客户将药物不良反应报告处理时间从数小时缩短到几分钟 [8] - 专业领域智能写作:通过两个智能体协同工作 生成格式合规、数据准确的专业报告 将撰写周期从数周大幅缩短 [9] 核心观点与战略意义 - 企业要像管理数据一样管理知识 将数据与知识转化为AI可用资产是企业从数字化迈向智能化的基石 [4] - 知识治理是AI在专业领域落地的基石 其重要性将超越算法优化本身 [4] - AI的专业化应用是一场“知识工程” 本质是将专业领域知识系统化、结构化的过程 [4] - 真正的智能不是“看到”文档而是“理解”逻辑 突破在于融合知识图谱、业务规则等多源知识 让AI能进行逻辑推理 [4]
金山办公朱熠锷:从“看到”到“掌握”:AI应用进入“知识增强生成”时代|Alpha峰会