知识图谱

搜索文档
人工智能和知识图谱:人工智能中知识图谱的概述
36氪· 2025-05-30 11:48
知识图谱定义与结构 - 知识图谱是由实体(节点)和关系(边)组成的结构化网络,用于以机器可读形式编码知识,实体对应现实世界概念(如人物、地点),边表示实体间关系(如"Person worksFor Company")[1][2] - 采用灵活的基于图的数据模型(如RDF或属性图),支持异构和动态数据,通过唯一ID或URI标识实体,属性可附加到节点和边上以补充详细信息[2] - 与传统关系数据库相比,知识图谱能更好地捕获信息上下文和含义,促进数据整合与新事实推断[2] 知识图谱在AI中的作用 - 为AI系统提供结构化背景知识,支持多跳连接查询、逻辑规则应用和上下文关联,增强语义理解与推理能力[3][4] - 主要应用包括:知识集成(打破数据孤岛)、语义丰富(为NLP/ML添加语境)、逻辑推理(推断新事实)、人机交互(生成可解释答案)[3][4] - 通过链接多源数据(如客户数据、社交媒体)实现全局分析,例如图像识别系统可结合知识图谱提升对象分类理解[3] 知识图谱的优势 - 减少AI数据需求:编码先验知识(如"阿司匹林治疗头痛")可降低对大规模标注数据的依赖[5] - 改进迁移学习:跨任务复用图谱知识(如城市道路网络理解),无需重新训练[6] - 增强可解释性:通过关系链追溯决策依据(如金融AI标记欺诈交易的原因)[6] - 提升互操作性:共享词汇表和标识符实现跨系统数据整合,如谷歌搜索利用知识图谱优化结果[7] 历史演变 - 概念源于20世纪60年代语义网络,经语义网(RDF/OWL标准)和链接数据(2006年)发展,2012年谷歌知识图谱推动商业化应用[8] - 当前形态包括领域专用图谱(医疗/金融)、开放知识库(Wikidata)和企业知识图谱,动态图谱可自动更新(如整合新研究成果)[8] - 科技巨头自建图谱案例:微软Satori、Facebook实体图谱[8] 最新技术进展(2023-2025) - **与LLM融合**:KG作为外部知识源减少LLM幻觉,支持检索增强生成(RAG);LLM辅助自动化KG构建(实体/关系提取)[9][10][11] - **嵌入与图机器学习**:TransE/ComplEx等嵌入模型升级,结合GNN/Transformer处理复杂关系;基准测试(FB15k-237)推动链接预测精度提升[12][13] - **自动推理**:SPARQL优化器改进,神经符号系统处理不确定性;超关系图谱支持n元事实推理,查询语言扩展(Cypher/GSQL)[14][15] 新兴趋势 - 企业级自动化管理(AI驱动构建/更新)与可信AI(决策溯源)成为重点[16][17] - 领域专用图谱(生物医学/法律)快速发展,多模态集成(图像/音频链接实体)受关注[16] - 知识嵌入2.0融合本体与文本描述,混合符号-神经方法成为研究方向[16]
【新华解读】知识图谱“国标”发布 四大行业迎智能化升级新机遇
新华财经· 2025-05-27 16:15
核心技术框架 - 协议围绕知识描述规则、基于文件的知识交换和基于消息的知识交换展开,为知识图谱的构建、存储和共享提供标准化规范 [1] - 知识描述规则包括本体描述和实例描述两类,本体描述涵盖基础信息、实体类型、关系类型等,实例描述包括实体、关系和属性的具体实例 [2] - 基于文件的知识交换定义了知识文件的结构,要求包含文件说明、本体和实例部分,并对文件描述信息和管理信息提出明确要求 [2] - 基于消息的知识交换详细描述了知识交换的消息结构,包括请求消息、应答消息等,支持同步和异步两种交换模式 [2] 适用行业场景 - 协议适用于金融、医疗健康、智能制造和公共安全领域,促进跨领域知识共享与协作 [3] - 金融领域可实现客户信息、交易数据的高效共享,提升风险评估、欺诈检测等业务的精准性 [3] - 医疗健康领域可加速新药研发和疾病诊断进程,通过共享患者信息和研究成果 [3] - 智能制造行业可优化生产调度、提高设备利用率,实现设备数据和生产流程知识的互联互通 [3] - 公共安全领域可建立统一知识图谱,实现公共安全事件、风险评估等关键信息的高效共享,提升救援效率 [3] 数据隐私与安全 - 协议要求所有知识交换消息采用加密传输技术,确保数据传输的机密性 [4] - 建立严格的访问控制体系,通过身份验证和权限管理确保敏感信息仅被授权用户访问 [4] - 对特别敏感的数据推荐采用数据脱敏技术,包括替换、匿名化等方法 [4] - 引用GB/T43697—2024等权威数据安全标准,构建全方位、多层次的数据安全防护体系 [4] 对人工智能产业链的影响 - 统一技术标准促进企业、研究机构之间的知识共享与协作,降低不同系统间的对接难度 [5] - 标准化知识描述和交换协议减少行业沟通成本,提升知识图谱产品的兼容性和互操作性 [5] - 开发者能更快掌握知识图谱核心技术,降低技术学习门槛,加快技术从研发到实际应用的转化速度 [5] 国际互联互通与未来迭代 - 协议采用国际通用的知识表示框架(如RDF、OWL)和数据交换格式(如JSON、XML),支持与国际知识图谱体系的互联互通 [6] - 有关部门正在编制国际标准协议IEEE P2807.8《知识图谱间知识融合的知识交换协议标准》 [6]
特斯联完成战略升级:三项核心业务聚焦空间智能
经济观察网· 2025-05-22 16:23
战略升级 - 公司向港交所递交更新版招股书,首次披露全新升级的三大战略板块:AIoT领域模型、AIoT基础设施、AIoT智能体,聚焦空间智能 [1] - 战略转型升级源于大模型浪潮驱动下,科技企业在GPU裸机上层搭建框架普遍需要额外投入,而公司具备软硬结合的基因,使贯通顶层模型、应用及底层基础设施的业务纵深向延展成为独特优势 [1] - 基础模型能力的不断跃迁,使得作为第三代AI核心方向的"空间智能"加速进入行业视野 [1] 业务架构 - 公司是中国AIoT行业的参与者,致力于以科技推动产业升级及空间智能以实现可持续发展,产品已获全球逾160座城市的800多个客户部署,覆盖阿联酋、新加坡、澳大利亚等国家 [2] - AIoT领域模型是公司空间智能的分析引擎,采用"多模态"及"模型+系统+应用"的商业化策略,打造专注于空间内各垂直场景的系列领域模型及智能应用 [2] - AIoT基础设施及其全栈智算产品套件是公司空间智能生态的基础,以高效能绿色智算体为核心产品 [2] - AIoT智能体作为公司空间智能解决方案的统筹交互界面,以机器人与智能穿戴设备为核心载体,作用于企业级用户级终端消费者 [3] 技术能力 - 公司推出全新升级版绿色智算体,全面支持华为昇腾、昆仑芯、寒武纪、燧源、沐曦、壁仞等信创芯片,并适配DeepSeek-R1/V3系列、Qwen系列等前沿大模型的推理和训练任务,构建具备"芯、网、云、智"能力的全链路工具包 [3] - 针对异构算力的纳管需求推出X-Stack智算云平台,提供计算虚拟化、存储虚拟化、网络虚拟化、资源池化、网络安全等服务,计算资源利用率最高可达97% [3] - 在类人思考方向,模型开创性地引入端到端强化学习方法,使用高质量数据微调训练出HALI基础模型,通过奖励函数引导模型在与工具/设备/环境的交互中不断优化策略 [4] - 在长期记忆方向,采用基于知识图谱的数据压缩存储和检索技术,使模型能够既保持超长的记忆,又能快速从历史数据中恢复记忆 [4] 财务表现 - 公司2024年年度收入为18.43亿元,相较2023年大幅提升83.2%,2022年、2023年、2024年收入分别为7.38亿元、10.06亿元及18.43亿元,三年年复合增长率达58.0% [5] - 2024年三费费用率由2023年的76.9%下降至45.0%,应收账款周转天数从2022年的238天、23年的180天进一步缩短至104天 [5] - 2024年AI产业数智化业务收入自2023年的6.24亿元大幅提升162.9%至16.4亿元,贡献了2024年业务收入的最大涨幅 [6] - 年度总客户数量由2023年的330个提升至342个,其中255个来自产业数智化业务,约占总客户数量的74.5%,截至2024年12月31日在手订单达23亿 [6] 资本动态 - 2025年1月起始,公司D++轮投资获得所得款项6.55亿元,新入股股东包含青岛汇铸、诺哲瑞英、青岛得厚、九江鄱湖、长沙经开、上海瑞力等 [6] 行业前景 - 2024年全球空间计算市场规模约为1495.9亿美元,并预计将在2034年突破10661.3亿美元,年复合增长率达21.7%,其中亚太市场年复合增长率为22.2%,高于全球平均水平 [7]
Spring 之父:我不是 Java 的“黑粉”,但我也不想再碰它!这门语言拯救了我......
猿大侠· 2025-05-22 11:29
Spring框架的诞生与发展 - Spring框架的核心理念源于Rod Johnson在1999-2000年伦敦工作期间提出的依赖注入思想,并通过其著作传播后发展为开源项目[3] - 框架成功的关键因素包括:开发者团队质量(如Juergen Hoeller)、社区专业文化、以及早期明确的商业化路径(2004年已规划可行商业模式)[5] - 与同期竞品JBoss不同,Spring通过技术创新(如解决WebSphere兼容性问题)而非单纯开源替代实现差异化[6] Kotlin语言优势与采用动因 - Kotlin具备Python的清晰可读性优势,同时规避了其类型系统弱点,并完美兼容JVM生态(如Spring/Jackson集成)[12][24] - 语言设计注重实用性:特性源自实际需求(如借鉴Scala经验但简化复杂度),避免学术化倾向[11][32] - 开发者迁移成本低:学习曲线平缓(2个月可熟练),LLM工具支持度高(代码建议质量优于Java/Python)[10][14][16] Kotlin与Spring的协同效应 - 技术契合度高:Spring的构造函数注入模式与Kotlin不可变对象特性天然匹配,XML配置已完全淘汰[24][25] - 现代Spring开发中,Kotlin能显著减少样板代码(如数据类自动注入),但JPA因可变性设计与Kotlin风格存在轻微冲突[25][26] - Spring官方文档全面支持Kotlin示例,集成问题极少(仅类默认open需适应),成熟度已达工业级标准[27] 行业生态与未来趋势 - Kotlin成功关键在JVM生态整合:与Java库互操作性近乎完美(零成本调用Spring/Jackson等),远胜Scala的历史问题[22] - 未来演进方向:需保持Java生态兼容性,可能引入联合类型等实用特性,但应避免TypeScript式的过度复杂类型系统[30][31] - 在AI开发领域,Kotlin+Spring AI组合可替代Python成为JVM系企业的生成式技术选项,提升现有技术栈利用率[34]
知识图谱与隐私计算双轮驱动 中国银联助力金融支付风险防控能力升级
经济观察报· 2025-05-20 15:26
关键技术突破 - 研发超大规模图谱网络构建和检索方法 构建十亿节点百亿边的金融交易图谱网络 实现毫秒级响应查询 [2] - 提出基于加盐哈希的匿踪查询安全方案 设计非对称加密高性能匿踪查询技术 实现跨域多方安全数据高效开放共享 [2] - 创新数据与知识混合驱动的金融欺诈违规侦测技术 解决小样本 不均衡样本场景的异常欺诈侦测难题 [2] 风险防控能力建设 - 建成金融欺诈违规智能侦测平台 构建百亿级规模金融支付交易图谱 亿级用户及商户风险画像 覆盖6个风控场景 [3] - 构建金融欺诈数据开放共享平台 通过隐私计算技术实现多方风险信息安全共享 [3] - 牵头构建隐私计算异构平台互联互通标准 在商业银行 科技公司 互联网机构实现互联互通 [3] 产业化应用成果 - 联合近40家金融机构 通信运营商开展示范应用 覆盖多种类型银行及科技企业 [4] - 技术成果有效提升欺诈识别准确率 为金融机构精准识别客户风险等级提供支撑 [4] - 未来将持续深化技术迭代 推动数据共融 模型共建 产品共研 助力金融支付风险防控基础设施建设 [4]
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
量子位· 2025-04-07 12:19
KG-SFT团队 投稿 量子位 | 公众号 QbitAI 让大语言模型更懂特定领域知识,有新招了! 来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架—— 知识图谱驱动的监督微调(KG-SFT) ,该框架通过 引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。 实验结果表明,其在多个领域和多种语言的数据集上取得了显著的效果, 成功入选ICLR 2025 。 截至目前,LLMs在常识问答方面表现越来越出色,但它们对领域知识的理解和推理能力仍然有限。 由于难以深入理解专业领域问答背后所蕴含的复杂知识和逻辑关系,因此在面对这类问题时,往往无法准确地给出正确的答案和详细的推理过 程,这极大地限制了其在专业领域的应用价值。 尤其是在数据稀少和知识密集型的场景中, 如何让LLMs更好地理解和操纵知识,成为了研究的关键 。 而中科大MIRA实验室的这项工作即围绕此展开。 KG-SFT是如何工作的 KG-SFT针对LLMs难以理解领域问答背后的知识和逻辑,导致 推理能力弱 的问题,提出 基于知识图谱增强的大语言模型监督微调 技术。 KG-SFT首先通过解析领域知识图谱中的 ...
【广发金工】从知识库到知识图谱:DeepSeek&GraphRAG
广发金融工程研究· 2025-02-26 13:04
文章核心观点 国内大模型公司“深度求索”开发的DeepSeek-V3和DeepSeek-R1以极低训练成本实现与顶尖模型媲美的性能 ,报告介绍其部署和运行测试方法 ,并探讨GraphRAG与大模型在金融投研领域的应用 [1][5] DeepSeek部署与运行测试 各版本DeepSeek模型与部署所需硬件对应关系 - 大模型训练和推理用英伟达显卡搭配CUDA平台 ,部署模型所需显存用于保存模型权重等 ,显存M(GB)与模型参数量P、参数精度Q等有关 ,如P=7B、Q为16位浮点精度时 ,M=16.8GB [6] - 不同参数版本模型所需显存和对应显卡不同 ,如1.5B参数模型需3.6G显存 ,对应NVIDIA 4060 [7] 部署流程介绍 - DeepSeek模型开源 ,可公开下载 ,主流本地化部署方式有从HuggingFace下载调用和用Ollama、LM Studio平台部署 ,以Ollama为例 ,需访问官网下载终端 ,搜索模型版本 ,在cmd输入命令运行 [8] - Ollama本地模型默认端口为11434 ,其他应用调用时修改访问请求base_url [9] 简单问答测试 - 测试本地部署14B模型推理能力及与满血版差距 ,14B版本在部分逻辑题展现较强推理能力 ,但在复杂逻辑推理任务中与满血版有差距 [10][12] GraphRAG与大模型应用介绍 Langchain与RAG介绍 - 开源框架Langchain集成RAG和Agent功能提升大模型在专业垂直领域回答水平 [13] - RAG即检索增强生成 ,使大模型生成回答时读取外部信息 ,减少模型幻觉 ,生成更精准答案 ,包括检索、增强、生成三步 [14] - Agent是智能体系统 ,可自主感知环境、决策和执行行动 ,适用于自动化任务等应用 [15] GraphRAG - RAG效果未达预期 ,存在数据处理和相关性搜索问题 ,难以从全局考虑问题和进行总结归纳 [16][19] - GraphRAG由微软开源 ,通过构建知识图谱和社区摘要扩展RAG能力 ,特点有增强知识表示、可解释和可验证、复杂推理、知识来源灵活等 ,还能降低Token成本 ,支持增量索引和动态更新 [20][23] - GraphRAG流程包括文本单元切分、实体和关系提取、实体消解、图构建、社区总结 ,检索方案有全局搜索、局部搜索、DRIFT搜索 [24][27][29] - 蚂蚁基于GraphRAG构建DB - GPT ,是开源AI原生数据应用开发框架 ,让围绕数据库构建大模型应用更简单 [29][30] - GraphRAG应用场景拓宽到金融、医疗、法律等领域 ,如学术研究、法律情境、电子商务等 [31] 金融知识图谱GraphRAG&DeepSeek实践 金融知识图谱介绍 - 金融知识图谱以图结构表示金融领域知识 ,用于风险控制、投资决策、市场监管等 ,如FP2KG数据集有17,799实体等 [34][35] - 知识图谱可梳理投研领域实体和关系 ,减轻投研负担 ,辅助投资决策 [36] GraphRAG部署流程 - 用微软开源GraphRAG版本 ,结合DeepSeek大模型和研报数据构建知识图谱 ,步骤包括安装库、新建文件夹、下载数据、项目初始化、构建图谱、提问搜索等 [37][40][41] - 需调整提示词语言确保结果实用性 ,若换模型需调整settings.yaml参数 [41] 基于研报的知识图谱搭建 - 以传媒行业游戏板块和计算机行业个股研报等为输入 ,GraphRAG回答问题准确性和完整性高 ,能准确识别实体关联 [43][44][51] - 输出的社区报告表、实体关系表和实体表等结构化数据可用于后续筛选、处理 ,还可将图谱可视化 [45][49][50]