知识图谱
搜索文档
【新华解读】知识图谱“国标”发布 四大行业迎智能化升级新机遇
新华财经· 2025-05-27 16:15
核心技术框架 - 协议围绕知识描述规则、基于文件的知识交换和基于消息的知识交换展开,为知识图谱的构建、存储和共享提供标准化规范 [1] - 知识描述规则包括本体描述和实例描述两类,本体描述涵盖基础信息、实体类型、关系类型等,实例描述包括实体、关系和属性的具体实例 [2] - 基于文件的知识交换定义了知识文件的结构,要求包含文件说明、本体和实例部分,并对文件描述信息和管理信息提出明确要求 [2] - 基于消息的知识交换详细描述了知识交换的消息结构,包括请求消息、应答消息等,支持同步和异步两种交换模式 [2] 适用行业场景 - 协议适用于金融、医疗健康、智能制造和公共安全领域,促进跨领域知识共享与协作 [3] - 金融领域可实现客户信息、交易数据的高效共享,提升风险评估、欺诈检测等业务的精准性 [3] - 医疗健康领域可加速新药研发和疾病诊断进程,通过共享患者信息和研究成果 [3] - 智能制造行业可优化生产调度、提高设备利用率,实现设备数据和生产流程知识的互联互通 [3] - 公共安全领域可建立统一知识图谱,实现公共安全事件、风险评估等关键信息的高效共享,提升救援效率 [3] 数据隐私与安全 - 协议要求所有知识交换消息采用加密传输技术,确保数据传输的机密性 [4] - 建立严格的访问控制体系,通过身份验证和权限管理确保敏感信息仅被授权用户访问 [4] - 对特别敏感的数据推荐采用数据脱敏技术,包括替换、匿名化等方法 [4] - 引用GB/T43697—2024等权威数据安全标准,构建全方位、多层次的数据安全防护体系 [4] 对人工智能产业链的影响 - 统一技术标准促进企业、研究机构之间的知识共享与协作,降低不同系统间的对接难度 [5] - 标准化知识描述和交换协议减少行业沟通成本,提升知识图谱产品的兼容性和互操作性 [5] - 开发者能更快掌握知识图谱核心技术,降低技术学习门槛,加快技术从研发到实际应用的转化速度 [5] 国际互联互通与未来迭代 - 协议采用国际通用的知识表示框架(如RDF、OWL)和数据交换格式(如JSON、XML),支持与国际知识图谱体系的互联互通 [6] - 有关部门正在编制国际标准协议IEEE P2807.8《知识图谱间知识融合的知识交换协议标准》 [6]
特斯联完成战略升级:三项核心业务聚焦空间智能
经济观察网· 2025-05-22 16:23
战略升级 - 公司向港交所递交更新版招股书,首次披露全新升级的三大战略板块:AIoT领域模型、AIoT基础设施、AIoT智能体,聚焦空间智能 [1] - 战略转型升级源于大模型浪潮驱动下,科技企业在GPU裸机上层搭建框架普遍需要额外投入,而公司具备软硬结合的基因,使贯通顶层模型、应用及底层基础设施的业务纵深向延展成为独特优势 [1] - 基础模型能力的不断跃迁,使得作为第三代AI核心方向的"空间智能"加速进入行业视野 [1] 业务架构 - 公司是中国AIoT行业的参与者,致力于以科技推动产业升级及空间智能以实现可持续发展,产品已获全球逾160座城市的800多个客户部署,覆盖阿联酋、新加坡、澳大利亚等国家 [2] - AIoT领域模型是公司空间智能的分析引擎,采用"多模态"及"模型+系统+应用"的商业化策略,打造专注于空间内各垂直场景的系列领域模型及智能应用 [2] - AIoT基础设施及其全栈智算产品套件是公司空间智能生态的基础,以高效能绿色智算体为核心产品 [2] - AIoT智能体作为公司空间智能解决方案的统筹交互界面,以机器人与智能穿戴设备为核心载体,作用于企业级用户级终端消费者 [3] 技术能力 - 公司推出全新升级版绿色智算体,全面支持华为昇腾、昆仑芯、寒武纪、燧源、沐曦、壁仞等信创芯片,并适配DeepSeek-R1/V3系列、Qwen系列等前沿大模型的推理和训练任务,构建具备"芯、网、云、智"能力的全链路工具包 [3] - 针对异构算力的纳管需求推出X-Stack智算云平台,提供计算虚拟化、存储虚拟化、网络虚拟化、资源池化、网络安全等服务,计算资源利用率最高可达97% [3] - 在类人思考方向,模型开创性地引入端到端强化学习方法,使用高质量数据微调训练出HALI基础模型,通过奖励函数引导模型在与工具/设备/环境的交互中不断优化策略 [4] - 在长期记忆方向,采用基于知识图谱的数据压缩存储和检索技术,使模型能够既保持超长的记忆,又能快速从历史数据中恢复记忆 [4] 财务表现 - 公司2024年年度收入为18.43亿元,相较2023年大幅提升83.2%,2022年、2023年、2024年收入分别为7.38亿元、10.06亿元及18.43亿元,三年年复合增长率达58.0% [5] - 2024年三费费用率由2023年的76.9%下降至45.0%,应收账款周转天数从2022年的238天、23年的180天进一步缩短至104天 [5] - 2024年AI产业数智化业务收入自2023年的6.24亿元大幅提升162.9%至16.4亿元,贡献了2024年业务收入的最大涨幅 [6] - 年度总客户数量由2023年的330个提升至342个,其中255个来自产业数智化业务,约占总客户数量的74.5%,截至2024年12月31日在手订单达23亿 [6] 资本动态 - 2025年1月起始,公司D++轮投资获得所得款项6.55亿元,新入股股东包含青岛汇铸、诺哲瑞英、青岛得厚、九江鄱湖、长沙经开、上海瑞力等 [6] 行业前景 - 2024年全球空间计算市场规模约为1495.9亿美元,并预计将在2034年突破10661.3亿美元,年复合增长率达21.7%,其中亚太市场年复合增长率为22.2%,高于全球平均水平 [7]
Spring 之父:我不是 Java 的“黑粉”,但我也不想再碰它!这门语言拯救了我......
猿大侠· 2025-05-22 11:29
Spring框架的诞生与发展 - Spring框架的核心理念源于Rod Johnson在1999-2000年伦敦工作期间提出的依赖注入思想,并通过其著作传播后发展为开源项目[3] - 框架成功的关键因素包括:开发者团队质量(如Juergen Hoeller)、社区专业文化、以及早期明确的商业化路径(2004年已规划可行商业模式)[5] - 与同期竞品JBoss不同,Spring通过技术创新(如解决WebSphere兼容性问题)而非单纯开源替代实现差异化[6] Kotlin语言优势与采用动因 - Kotlin具备Python的清晰可读性优势,同时规避了其类型系统弱点,并完美兼容JVM生态(如Spring/Jackson集成)[12][24] - 语言设计注重实用性:特性源自实际需求(如借鉴Scala经验但简化复杂度),避免学术化倾向[11][32] - 开发者迁移成本低:学习曲线平缓(2个月可熟练),LLM工具支持度高(代码建议质量优于Java/Python)[10][14][16] Kotlin与Spring的协同效应 - 技术契合度高:Spring的构造函数注入模式与Kotlin不可变对象特性天然匹配,XML配置已完全淘汰[24][25] - 现代Spring开发中,Kotlin能显著减少样板代码(如数据类自动注入),但JPA因可变性设计与Kotlin风格存在轻微冲突[25][26] - Spring官方文档全面支持Kotlin示例,集成问题极少(仅类默认open需适应),成熟度已达工业级标准[27] 行业生态与未来趋势 - Kotlin成功关键在JVM生态整合:与Java库互操作性近乎完美(零成本调用Spring/Jackson等),远胜Scala的历史问题[22] - 未来演进方向:需保持Java生态兼容性,可能引入联合类型等实用特性,但应避免TypeScript式的过度复杂类型系统[30][31] - 在AI开发领域,Kotlin+Spring AI组合可替代Python成为JVM系企业的生成式技术选项,提升现有技术栈利用率[34]
知识图谱与隐私计算双轮驱动 中国银联助力金融支付风险防控能力升级
经济观察报· 2025-05-20 15:26
关键技术突破 - 研发超大规模图谱网络构建和检索方法 构建十亿节点百亿边的金融交易图谱网络 实现毫秒级响应查询 [2] - 提出基于加盐哈希的匿踪查询安全方案 设计非对称加密高性能匿踪查询技术 实现跨域多方安全数据高效开放共享 [2] - 创新数据与知识混合驱动的金融欺诈违规侦测技术 解决小样本 不均衡样本场景的异常欺诈侦测难题 [2] 风险防控能力建设 - 建成金融欺诈违规智能侦测平台 构建百亿级规模金融支付交易图谱 亿级用户及商户风险画像 覆盖6个风控场景 [3] - 构建金融欺诈数据开放共享平台 通过隐私计算技术实现多方风险信息安全共享 [3] - 牵头构建隐私计算异构平台互联互通标准 在商业银行 科技公司 互联网机构实现互联互通 [3] 产业化应用成果 - 联合近40家金融机构 通信运营商开展示范应用 覆盖多种类型银行及科技企业 [4] - 技术成果有效提升欺诈识别准确率 为金融机构精准识别客户风险等级提供支撑 [4] - 未来将持续深化技术迭代 推动数据共融 模型共建 产品共研 助力金融支付风险防控基础设施建设 [4]
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
量子位· 2025-04-07 12:19
文章核心观点 - 中国科学技术大学MIRA实验室王杰教授团队提出一个创新框架KG-SFT,旨在通过引入知识图谱来提升大语言模型在特定领域的知识理解和处理能力[1] - 该框架通过生成蕴含丰富领域知识和逻辑关系的推理过程,解决了LLMs在专业领域知识理解和推理能力弱的问题[6][7] - 实验结果表明,KG-SFT在多个领域和语言的数据集上效果显著,尤其在低数据场景下性能提升明显,并成功入选ICLR 2025[2][19][20] KG-SFT框架工作机制 - 框架核心是将知识图谱与监督微调相结合,通过生成逻辑严密的推理过程解释来增强LLMs对知识和逻辑的理解[6][7] - 框架包含三个关键组件:Extractor、Generator和Detector[8][10] Extractor组件 - 负责对问答对中的实体进行识别,并从外部知识图谱中提取相关的推理子图[11] - 通过命名实体识别和多条推理路径检索,有效揭示Q&A对背后的知识关联和逻辑[12][13] Generator组件 - 利用图结构重要性评分算法对推理子图中的实体和关系进行评分,选择高分部分作为重要内容[14] - 使用大型语言模型生成逻辑清晰、流畅的解释草稿,帮助LLMs理解问题与答案间的关系[15][16] Detector组件 - 对生成的解释草稿进行句子级别的知识冲突检测,确保解释的正确性[17] - 通过自然语言推理模型和重新引导机制,标记并纠正可能存在的知识冲突,提高解释可靠性[18] 实验结果与性能 - 在低数据医学问答任务中,KG-SFT在英语场景下仅使用5%的训练数据就比传统方法提高近14%的准确率[20] - 具体数据表明,在5%训练数据下,MedQA英语准确率从26.02%提升至40.00%,MedQA中文从35.57%提升至38.83%[21] - KG-SFT可作为插件式模块与现有数据增强方法结合使用,进一步提升性能,例如与AugGPT结合在MedQA英语上从40.29%提升至40.92%[23][24] - 该方法在多个领域数据集上展现出广泛适用性,尽管在形式逻辑等复杂推理领域表现稍逊,但整体竞争力较强[24][25]
【广发金工】从知识库到知识图谱:DeepSeek&GraphRAG
广发金融工程研究· 2025-02-26 13:04
文章核心观点 国内大模型公司“深度求索”开发的DeepSeek-V3和DeepSeek-R1以极低训练成本实现与顶尖模型媲美的性能 ,报告介绍其部署和运行测试方法 ,并探讨GraphRAG与大模型在金融投研领域的应用 [1][5] DeepSeek部署与运行测试 各版本DeepSeek模型与部署所需硬件对应关系 - 大模型训练和推理用英伟达显卡搭配CUDA平台 ,部署模型所需显存用于保存模型权重等 ,显存M(GB)与模型参数量P、参数精度Q等有关 ,如P=7B、Q为16位浮点精度时 ,M=16.8GB [6] - 不同参数版本模型所需显存和对应显卡不同 ,如1.5B参数模型需3.6G显存 ,对应NVIDIA 4060 [7] 部署流程介绍 - DeepSeek模型开源 ,可公开下载 ,主流本地化部署方式有从HuggingFace下载调用和用Ollama、LM Studio平台部署 ,以Ollama为例 ,需访问官网下载终端 ,搜索模型版本 ,在cmd输入命令运行 [8] - Ollama本地模型默认端口为11434 ,其他应用调用时修改访问请求base_url [9] 简单问答测试 - 测试本地部署14B模型推理能力及与满血版差距 ,14B版本在部分逻辑题展现较强推理能力 ,但在复杂逻辑推理任务中与满血版有差距 [10][12] GraphRAG与大模型应用介绍 Langchain与RAG介绍 - 开源框架Langchain集成RAG和Agent功能提升大模型在专业垂直领域回答水平 [13] - RAG即检索增强生成 ,使大模型生成回答时读取外部信息 ,减少模型幻觉 ,生成更精准答案 ,包括检索、增强、生成三步 [14] - Agent是智能体系统 ,可自主感知环境、决策和执行行动 ,适用于自动化任务等应用 [15] GraphRAG - RAG效果未达预期 ,存在数据处理和相关性搜索问题 ,难以从全局考虑问题和进行总结归纳 [16][19] - GraphRAG由微软开源 ,通过构建知识图谱和社区摘要扩展RAG能力 ,特点有增强知识表示、可解释和可验证、复杂推理、知识来源灵活等 ,还能降低Token成本 ,支持增量索引和动态更新 [20][23] - GraphRAG流程包括文本单元切分、实体和关系提取、实体消解、图构建、社区总结 ,检索方案有全局搜索、局部搜索、DRIFT搜索 [24][27][29] - 蚂蚁基于GraphRAG构建DB - GPT ,是开源AI原生数据应用开发框架 ,让围绕数据库构建大模型应用更简单 [29][30] - GraphRAG应用场景拓宽到金融、医疗、法律等领域 ,如学术研究、法律情境、电子商务等 [31] 金融知识图谱GraphRAG&DeepSeek实践 金融知识图谱介绍 - 金融知识图谱以图结构表示金融领域知识 ,用于风险控制、投资决策、市场监管等 ,如FP2KG数据集有17,799实体等 [34][35] - 知识图谱可梳理投研领域实体和关系 ,减轻投研负担 ,辅助投资决策 [36] GraphRAG部署流程 - 用微软开源GraphRAG版本 ,结合DeepSeek大模型和研报数据构建知识图谱 ,步骤包括安装库、新建文件夹、下载数据、项目初始化、构建图谱、提问搜索等 [37][40][41] - 需调整提示词语言确保结果实用性 ,若换模型需调整settings.yaml参数 [41] 基于研报的知识图谱搭建 - 以传媒行业游戏板块和计算机行业个股研报等为输入 ,GraphRAG回答问题准确性和完整性高 ,能准确识别实体关联 [43][44][51] - 输出的社区报告表、实体关系表和实体表等结构化数据可用于后续筛选、处理 ,还可将图谱可视化 [45][49][50]