Workflow
知识图谱
icon
搜索文档
Spring 之父:我不是 Java 的“黑粉”,但我也不想再碰它!这门语言拯救了我......
猿大侠· 2025-05-22 11:29
Spring框架的诞生与发展 - Spring框架的核心理念源于Rod Johnson在1999-2000年伦敦工作期间提出的依赖注入思想,并通过其著作传播后发展为开源项目[3] - 框架成功的关键因素包括:开发者团队质量(如Juergen Hoeller)、社区专业文化、以及早期明确的商业化路径(2004年已规划可行商业模式)[5] - 与同期竞品JBoss不同,Spring通过技术创新(如解决WebSphere兼容性问题)而非单纯开源替代实现差异化[6] Kotlin语言优势与采用动因 - Kotlin具备Python的清晰可读性优势,同时规避了其类型系统弱点,并完美兼容JVM生态(如Spring/Jackson集成)[12][24] - 语言设计注重实用性:特性源自实际需求(如借鉴Scala经验但简化复杂度),避免学术化倾向[11][32] - 开发者迁移成本低:学习曲线平缓(2个月可熟练),LLM工具支持度高(代码建议质量优于Java/Python)[10][14][16] Kotlin与Spring的协同效应 - 技术契合度高:Spring的构造函数注入模式与Kotlin不可变对象特性天然匹配,XML配置已完全淘汰[24][25] - 现代Spring开发中,Kotlin能显著减少样板代码(如数据类自动注入),但JPA因可变性设计与Kotlin风格存在轻微冲突[25][26] - Spring官方文档全面支持Kotlin示例,集成问题极少(仅类默认open需适应),成熟度已达工业级标准[27] 行业生态与未来趋势 - Kotlin成功关键在JVM生态整合:与Java库互操作性近乎完美(零成本调用Spring/Jackson等),远胜Scala的历史问题[22] - 未来演进方向:需保持Java生态兼容性,可能引入联合类型等实用特性,但应避免TypeScript式的过度复杂类型系统[30][31] - 在AI开发领域,Kotlin+Spring AI组合可替代Python成为JVM系企业的生成式技术选项,提升现有技术栈利用率[34]
知识图谱与隐私计算双轮驱动 中国银联助力金融支付风险防控能力升级
经济观察报· 2025-05-20 15:26
关键技术突破 - 研发超大规模图谱网络构建和检索方法 构建十亿节点百亿边的金融交易图谱网络 实现毫秒级响应查询 [2] - 提出基于加盐哈希的匿踪查询安全方案 设计非对称加密高性能匿踪查询技术 实现跨域多方安全数据高效开放共享 [2] - 创新数据与知识混合驱动的金融欺诈违规侦测技术 解决小样本 不均衡样本场景的异常欺诈侦测难题 [2] 风险防控能力建设 - 建成金融欺诈违规智能侦测平台 构建百亿级规模金融支付交易图谱 亿级用户及商户风险画像 覆盖6个风控场景 [3] - 构建金融欺诈数据开放共享平台 通过隐私计算技术实现多方风险信息安全共享 [3] - 牵头构建隐私计算异构平台互联互通标准 在商业银行 科技公司 互联网机构实现互联互通 [3] 产业化应用成果 - 联合近40家金融机构 通信运营商开展示范应用 覆盖多种类型银行及科技企业 [4] - 技术成果有效提升欺诈识别准确率 为金融机构精准识别客户风险等级提供支撑 [4] - 未来将持续深化技术迭代 推动数据共融 模型共建 产品共研 助力金融支付风险防控基础设施建设 [4]
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
量子位· 2025-04-07 12:19
KG-SFT团队 投稿 量子位 | 公众号 QbitAI 让大语言模型更懂特定领域知识,有新招了! 来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架—— 知识图谱驱动的监督微调(KG-SFT) ,该框架通过 引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。 实验结果表明,其在多个领域和多种语言的数据集上取得了显著的效果, 成功入选ICLR 2025 。 截至目前,LLMs在常识问答方面表现越来越出色,但它们对领域知识的理解和推理能力仍然有限。 由于难以深入理解专业领域问答背后所蕴含的复杂知识和逻辑关系,因此在面对这类问题时,往往无法准确地给出正确的答案和详细的推理过 程,这极大地限制了其在专业领域的应用价值。 尤其是在数据稀少和知识密集型的场景中, 如何让LLMs更好地理解和操纵知识,成为了研究的关键 。 而中科大MIRA实验室的这项工作即围绕此展开。 KG-SFT是如何工作的 KG-SFT针对LLMs难以理解领域问答背后的知识和逻辑,导致 推理能力弱 的问题,提出 基于知识图谱增强的大语言模型监督微调 技术。 KG-SFT首先通过解析领域知识图谱中的 ...
【广发金工】从知识库到知识图谱:DeepSeek&GraphRAG
广发金融工程研究· 2025-02-26 13:04
文章核心观点 国内大模型公司“深度求索”开发的DeepSeek-V3和DeepSeek-R1以极低训练成本实现与顶尖模型媲美的性能 ,报告介绍其部署和运行测试方法 ,并探讨GraphRAG与大模型在金融投研领域的应用 [1][5] DeepSeek部署与运行测试 各版本DeepSeek模型与部署所需硬件对应关系 - 大模型训练和推理用英伟达显卡搭配CUDA平台 ,部署模型所需显存用于保存模型权重等 ,显存M(GB)与模型参数量P、参数精度Q等有关 ,如P=7B、Q为16位浮点精度时 ,M=16.8GB [6] - 不同参数版本模型所需显存和对应显卡不同 ,如1.5B参数模型需3.6G显存 ,对应NVIDIA 4060 [7] 部署流程介绍 - DeepSeek模型开源 ,可公开下载 ,主流本地化部署方式有从HuggingFace下载调用和用Ollama、LM Studio平台部署 ,以Ollama为例 ,需访问官网下载终端 ,搜索模型版本 ,在cmd输入命令运行 [8] - Ollama本地模型默认端口为11434 ,其他应用调用时修改访问请求base_url [9] 简单问答测试 - 测试本地部署14B模型推理能力及与满血版差距 ,14B版本在部分逻辑题展现较强推理能力 ,但在复杂逻辑推理任务中与满血版有差距 [10][12] GraphRAG与大模型应用介绍 Langchain与RAG介绍 - 开源框架Langchain集成RAG和Agent功能提升大模型在专业垂直领域回答水平 [13] - RAG即检索增强生成 ,使大模型生成回答时读取外部信息 ,减少模型幻觉 ,生成更精准答案 ,包括检索、增强、生成三步 [14] - Agent是智能体系统 ,可自主感知环境、决策和执行行动 ,适用于自动化任务等应用 [15] GraphRAG - RAG效果未达预期 ,存在数据处理和相关性搜索问题 ,难以从全局考虑问题和进行总结归纳 [16][19] - GraphRAG由微软开源 ,通过构建知识图谱和社区摘要扩展RAG能力 ,特点有增强知识表示、可解释和可验证、复杂推理、知识来源灵活等 ,还能降低Token成本 ,支持增量索引和动态更新 [20][23] - GraphRAG流程包括文本单元切分、实体和关系提取、实体消解、图构建、社区总结 ,检索方案有全局搜索、局部搜索、DRIFT搜索 [24][27][29] - 蚂蚁基于GraphRAG构建DB - GPT ,是开源AI原生数据应用开发框架 ,让围绕数据库构建大模型应用更简单 [29][30] - GraphRAG应用场景拓宽到金融、医疗、法律等领域 ,如学术研究、法律情境、电子商务等 [31] 金融知识图谱GraphRAG&DeepSeek实践 金融知识图谱介绍 - 金融知识图谱以图结构表示金融领域知识 ,用于风险控制、投资决策、市场监管等 ,如FP2KG数据集有17,799实体等 [34][35] - 知识图谱可梳理投研领域实体和关系 ,减轻投研负担 ,辅助投资决策 [36] GraphRAG部署流程 - 用微软开源GraphRAG版本 ,结合DeepSeek大模型和研报数据构建知识图谱 ,步骤包括安装库、新建文件夹、下载数据、项目初始化、构建图谱、提问搜索等 [37][40][41] - 需调整提示词语言确保结果实用性 ,若换模型需调整settings.yaml参数 [41] 基于研报的知识图谱搭建 - 以传媒行业游戏板块和计算机行业个股研报等为输入 ,GraphRAG回答问题准确性和完整性高 ,能准确识别实体关联 [43][44][51] - 输出的社区报告表、实体关系表和实体表等结构化数据可用于后续筛选、处理 ,还可将图谱可视化 [45][49][50]