Workflow
【广发金工】从知识库到知识图谱:DeepSeek&GraphRAG
广发证券广发证券(SZ:000776) 广发金融工程研究·2025-02-26 13:04

文章核心观点 国内大模型公司“深度求索”开发的DeepSeek-V3和DeepSeek-R1以极低训练成本实现与顶尖模型媲美的性能 ,报告介绍其部署和运行测试方法 ,并探讨GraphRAG与大模型在金融投研领域的应用 [1][5] DeepSeek部署与运行测试 各版本DeepSeek模型与部署所需硬件对应关系 - 大模型训练和推理用英伟达显卡搭配CUDA平台 ,部署模型所需显存用于保存模型权重等 ,显存M(GB)与模型参数量P、参数精度Q等有关 ,如P=7B、Q为16位浮点精度时 ,M=16.8GB [6] - 不同参数版本模型所需显存和对应显卡不同 ,如1.5B参数模型需3.6G显存 ,对应NVIDIA 4060 [7] 部署流程介绍 - DeepSeek模型开源 ,可公开下载 ,主流本地化部署方式有从HuggingFace下载调用和用Ollama、LM Studio平台部署 ,以Ollama为例 ,需访问官网下载终端 ,搜索模型版本 ,在cmd输入命令运行 [8] - Ollama本地模型默认端口为11434 ,其他应用调用时修改访问请求base_url [9] 简单问答测试 - 测试本地部署14B模型推理能力及与满血版差距 ,14B版本在部分逻辑题展现较强推理能力 ,但在复杂逻辑推理任务中与满血版有差距 [10][12] GraphRAG与大模型应用介绍 Langchain与RAG介绍 - 开源框架Langchain集成RAG和Agent功能提升大模型在专业垂直领域回答水平 [13] - RAG即检索增强生成 ,使大模型生成回答时读取外部信息 ,减少模型幻觉 ,生成更精准答案 ,包括检索、增强、生成三步 [14] - Agent是智能体系统 ,可自主感知环境、决策和执行行动 ,适用于自动化任务等应用 [15] GraphRAG - RAG效果未达预期 ,存在数据处理和相关性搜索问题 ,难以从全局考虑问题和进行总结归纳 [16][19] - GraphRAG由微软开源 ,通过构建知识图谱和社区摘要扩展RAG能力 ,特点有增强知识表示、可解释和可验证、复杂推理、知识来源灵活等 ,还能降低Token成本 ,支持增量索引和动态更新 [20][23] - GraphRAG流程包括文本单元切分、实体和关系提取、实体消解、图构建、社区总结 ,检索方案有全局搜索、局部搜索、DRIFT搜索 [24][27][29] - 蚂蚁基于GraphRAG构建DB - GPT ,是开源AI原生数据应用开发框架 ,让围绕数据库构建大模型应用更简单 [29][30] - GraphRAG应用场景拓宽到金融、医疗、法律等领域 ,如学术研究、法律情境、电子商务等 [31] 金融知识图谱GraphRAG&DeepSeek实践 金融知识图谱介绍 - 金融知识图谱以图结构表示金融领域知识 ,用于风险控制、投资决策、市场监管等 ,如FP2KG数据集有17,799实体等 [34][35] - 知识图谱可梳理投研领域实体和关系 ,减轻投研负担 ,辅助投资决策 [36] GraphRAG部署流程 - 用微软开源GraphRAG版本 ,结合DeepSeek大模型和研报数据构建知识图谱 ,步骤包括安装库、新建文件夹、下载数据、项目初始化、构建图谱、提问搜索等 [37][40][41] - 需调整提示词语言确保结果实用性 ,若换模型需调整settings.yaml参数 [41] 基于研报的知识图谱搭建 - 以传媒行业游戏板块和计算机行业个股研报等为输入 ,GraphRAG回答问题准确性和完整性高 ,能准确识别实体关联 [43][44][51] - 输出的社区报告表、实体关系表和实体表等结构化数据可用于后续筛选、处理 ,还可将图谱可视化 [45][49][50]