知识图谱
搜索文档
2025消费金融生态大会在渝召开 全国首个消费金融指数正式发布
证券时报网· 2025-06-06 23:35
2025消费金融生态大会 - 大会主题为"金融促消费·共启新征程",系统探讨金融赋能提振消费的破局方向 [1] - 由重庆市委金融办等部门指导,消费金融服务联盟和打击金融领域黑产联盟主办 [1] - 汇聚500余位政府、学术、金融和科技领域代表 [1] - 发布全国首个消费金融行业发展状况指数——2025中国消费金融指数(CCFI) [1] CCFI指数概况 - 围绕消费金融市场的主体建设、产业生态和市场环境三个维度构建 [2] - 运用12组33项指标评估国内30个典型城市消费金融综合发展状况 [2] - 综合排名前十城市:上海、北京、重庆、深圳、广州、杭州、成都、苏州、南京和济南 [2] - 上海、北京和重庆包揽所有分项前三名,处于国内第一梯队 [2] 消费金融机构实力 - 机构实力十强城市:重庆、上海、北京、深圳、广州、杭州、天津、南京、成都和苏州 [2] - 重庆消费金融供给主体包括银行类机构、消费金融公司、汽车金融公司和网络小贷等 [3] - 重庆3家消费金融公司合计贷款规模占全国同业29.1%,居全国首位 [3] - 重庆拥有37家网络小贷机构,包括7家注册资本超50亿元的头部企业 [3] 重庆消费金融发展 - 在"双中心"国家战略引领下,重庆成为国内重要消费金融发展高地 [3] - 构建多层次消费金融体系,超80家消费金融供给主体 [3] - 消费金融公司及网络小贷科技创新处于行业前沿,涉及大数据、AI等技术 [3] - 设立国家金融科技认证中心、成渝金融法院等金融基础设施 [4] - 打造"渝金通""渝金盾"金融大脑支持数字金融场景应用 [4]
全国首个消费金融指数发布 重庆消费金融行业提质增效
证券日报网· 2025-06-06 17:45
中国消费金融指数发布 - 国内首个公开发布的消费金融行业发展状况指数——2025中国消费金融指数(CCFI)正式发布 [1] - 指数以重庆为案例,总结重庆消费金融发展实践经验,提供"重庆标准" [1] - 消费金融供给主体包括银行类机构、非银类机构和地方金融组织 [1] 重庆消费金融发展水平 - 重庆与上海、北京并列国内消费金融综合发展第一梯队 [2] - 截至2024年底,重庆个人消费贷款余额达8922.53亿元(不含住房贷款),同比增长9.9% [2] - 重庆已构建涵盖80多家消费金融供给主体的多层次消费金融体系 [2] 重庆消费金融创新能力 - 重庆消费金融公司及网络小贷公司科技创新处于行业前沿 [2] - 涉及大数据、人工智能、知识图谱等技术发明和应用创新 [2] - 3家消费金融公司累计申请专利技术和获得发明专利授权量占全国同业一半以上 [2] - 37家网络小贷公司发明专利授权量和软件著作权量分别占全国同业的三分之二和三分之一 [2] 重庆金融基础设施 - 截至2024年底,重庆设有国家金融科技认证中心和成渝金融法院 [3] - 成立全国首个跨区域社会组织"成渝银行业保险业消费者权益保护中心(重庆)" [3] - 打造"渝金通""渝金盾"金融大脑,提供底层金融基础设施支持 [3]
人工智能和知识图谱:知识图谱的挑战、缺点和陷阱
36氪· 2025-06-06 08:27
知识图谱技术挑战 - 可扩展性和性能问题:知识图谱扩展到数十亿节点/边时难以保持复杂查询和更新性能 由于图数据高度互联 查询可能触及图谱大部分 分布式图数据库在跨分区连接时仍面临性能瓶颈 垂直扩展存在限制[1] - 更新可扩展性问题:大型知识图谱中添加或更改数据成本高 尤其是启用推理时可能触发重新计算 部分架构将实时图谱与分析图谱分离以提升交互速度 但增加管理复杂度[2] 数据质量与完整性 - 数据质量挑战:知识图谱常聚合多源数据 易出现不一致和错误 自动提取过程可能引入噪声 导致虚假或过时信息传播 高质量知识图谱需结合自动化与人工验证机制[3] - 不完整性风险:知识图谱存在固有缺失 可能导致AI系统误判为错误(封闭世界假设) 需设计查询逻辑考虑不确定性 添加完整性元数据区分未知与错误信息[4] 模式设计与本体管理 - 模式复杂性:本体工程需平衡过度具体与过度松散 模式演变成本高 例如零售知识图谱需重构以纳入数字产品等新实体 过度设计本体易导致项目停滞[5][6] - 与非结构化数据集成:从文本/表格提取信息时易产生歧义 需人工监督或复杂流程 完全自动化构建知识图谱仍存挑战 需置信度评分和专家验证[7] 动态数据处理与伦理问题 - 实时数据应对困难:传统三元组存储不擅长流式更新 动态知识图谱实现复杂 版本控制方案无法捕捉连续变化 实时场景需划分处理逻辑[8] - 偏见放大风险:知识图谱可能反映历史数据中的性别/文化偏见 影响AI决策公平性 需采用去偏技术如重新加权或添加反事实数据[9] - 隐私合规挑战:整合个人数据易违反GDPR 28%用户画像研究存在隐私问题 需设计匿名化/访问控制机制 但会降低实用性[10] 实施与维护障碍 - 技术栈碎片化:RDF/SPARQL等技术学习曲线陡峭 缺乏专业人才 工具标准化不足 影响项目推进[11] - 持续维护需求:知识图谱需定期更新和本体演进 否则价值衰减 需明确治理机制和反馈回路[12] - 遗留系统集成困难:与关系数据库连接存在性能/模型不匹配 业务人员对SPARQL接受度低 可能导致知识图谱脱离主流程[12]
人工智能和知识图谱:知识图谱在人工智能系统中的优势
36氪· 2025-06-05 10:19
知识图谱融入AI解决方案的优势 数据互操作性和集成 - 知识图谱通过通用语义层统一不同来源数据,使用共享标识符和本体连接孤立数据(如CRM客户资料与财务系统交易关联)[2] - 遵循RDF、schema org等标准实现互操作性,新数据源只需映射到本体即可低摩擦插入[2] - 支持全面查询所有数据,无需手动关联数据库ID,形成对客户、产品等核心业务实体的全方位了解[2] - 可作为语义数据湖,所有内容互联且可发现,减少AI开发中80%数据整理时间[2] 查询功能提升 - 支持复杂临时查询(如"召回零件供应商"或"间接合作作者"),单条SPARQL/Cypher查询即可实现多跳检索[3] - 允许任意遍历路径和本体推理(如查询"车辆"自动返回轿车、卡车等子类),使推荐引擎能查询"用户朋友的朋友偏好"等丰富问题[3] - 数据模型可动态扩展,新增实体类型不破坏现有查询,传统数据库难以实现此灵活性[3] 可解释性增强 - AI决策可追溯至知识图谱特定事实路径(如医疗推荐基于病情Y+指南Z+生物标志物W的显性关联)[4] - 提供出处信息(如通过"assertedInStudy"边链接至文献DOI),满足监管行业对数据溯源的需求[5] - 福布斯科技委员会指出知识图谱是提升AI可解释性、可审核性的关键要素[5] 训练数据效率优化 - 知识图谱编码常识减少对带标签数据依赖,计算机视觉中可实现零样本分类(如通过条纹特征识别未知动物霍加狓)[6][7] - NLP领域问答任务性能提升30%,因直接注入知识图谱事实而非依赖训练文本出现频率[7] - 医疗/法律等专业领域可利用专家构建的知识图谱弥补数据稀缺问题[7] 符号与统计AI结合 - 神经符号AI结合知识图谱的逻辑推理与机器学习模式识别,减少大型语言模型40%幻觉现象[8] - 知识图谱生成候选答案由ML排序,或ML生成假设由图谱验证,形成协同效应[8] - 2025年系统综述强调知识图谱与大语言模型对提升AI理解、推理能力至关重要[8] 复杂推理与合规支持 - 支持语义推理(如从亲属关系自动推断"阿姨"身份),扩展隐含知识并确保逻辑一致性[9] - 可编码业务规则(如贷款审批不违反监管条款),在医疗AI中避免药物相互作用等禁忌方案[9] 外部知识整合 - 链接schema org、维基数据等全球知识生态系统,电商产品可自动获取维基实体描述[10] - 通过明确表示人口统计属性,知识图谱可检测NLP模型中性别-职业关联偏差[10][11] 机器学习特征增强 - 实体属性转化为预测模型特征(如推荐系统中"hasGenre Sci-Fi"特征使准确率提升25%)[12] - NLP任务融入WordNet关系后,词义消歧任务F1值提高15个百分点[12]
人工智能和知识图谱:人工智能中知识图谱的概述
36氪· 2025-05-30 11:48
知识图谱定义与结构 - 知识图谱是由实体(节点)和关系(边)组成的结构化网络,用于以机器可读形式编码知识,实体对应现实世界概念(如人物、地点),边表示实体间关系(如"Person worksFor Company")[1][2] - 采用灵活的基于图的数据模型(如RDF或属性图),支持异构和动态数据,通过唯一ID或URI标识实体,属性可附加到节点和边上以补充详细信息[2] - 与传统关系数据库相比,知识图谱能更好地捕获信息上下文和含义,促进数据整合与新事实推断[2] 知识图谱在AI中的作用 - 为AI系统提供结构化背景知识,支持多跳连接查询、逻辑规则应用和上下文关联,增强语义理解与推理能力[3][4] - 主要应用包括:知识集成(打破数据孤岛)、语义丰富(为NLP/ML添加语境)、逻辑推理(推断新事实)、人机交互(生成可解释答案)[3][4] - 通过链接多源数据(如客户数据、社交媒体)实现全局分析,例如图像识别系统可结合知识图谱提升对象分类理解[3] 知识图谱的优势 - 减少AI数据需求:编码先验知识(如"阿司匹林治疗头痛")可降低对大规模标注数据的依赖[5] - 改进迁移学习:跨任务复用图谱知识(如城市道路网络理解),无需重新训练[6] - 增强可解释性:通过关系链追溯决策依据(如金融AI标记欺诈交易的原因)[6] - 提升互操作性:共享词汇表和标识符实现跨系统数据整合,如谷歌搜索利用知识图谱优化结果[7] 历史演变 - 概念源于20世纪60年代语义网络,经语义网(RDF/OWL标准)和链接数据(2006年)发展,2012年谷歌知识图谱推动商业化应用[8] - 当前形态包括领域专用图谱(医疗/金融)、开放知识库(Wikidata)和企业知识图谱,动态图谱可自动更新(如整合新研究成果)[8] - 科技巨头自建图谱案例:微软Satori、Facebook实体图谱[8] 最新技术进展(2023-2025) - **与LLM融合**:KG作为外部知识源减少LLM幻觉,支持检索增强生成(RAG);LLM辅助自动化KG构建(实体/关系提取)[9][10][11] - **嵌入与图机器学习**:TransE/ComplEx等嵌入模型升级,结合GNN/Transformer处理复杂关系;基准测试(FB15k-237)推动链接预测精度提升[12][13] - **自动推理**:SPARQL优化器改进,神经符号系统处理不确定性;超关系图谱支持n元事实推理,查询语言扩展(Cypher/GSQL)[14][15] 新兴趋势 - 企业级自动化管理(AI驱动构建/更新)与可信AI(决策溯源)成为重点[16][17] - 领域专用图谱(生物医学/法律)快速发展,多模态集成(图像/音频链接实体)受关注[16] - 知识嵌入2.0融合本体与文本描述,混合符号-神经方法成为研究方向[16]
【新华解读】知识图谱“国标”发布 四大行业迎智能化升级新机遇
新华财经· 2025-05-27 16:15
核心技术框架 - 协议围绕知识描述规则、基于文件的知识交换和基于消息的知识交换展开,为知识图谱的构建、存储和共享提供标准化规范 [1] - 知识描述规则包括本体描述和实例描述两类,本体描述涵盖基础信息、实体类型、关系类型等,实例描述包括实体、关系和属性的具体实例 [2] - 基于文件的知识交换定义了知识文件的结构,要求包含文件说明、本体和实例部分,并对文件描述信息和管理信息提出明确要求 [2] - 基于消息的知识交换详细描述了知识交换的消息结构,包括请求消息、应答消息等,支持同步和异步两种交换模式 [2] 适用行业场景 - 协议适用于金融、医疗健康、智能制造和公共安全领域,促进跨领域知识共享与协作 [3] - 金融领域可实现客户信息、交易数据的高效共享,提升风险评估、欺诈检测等业务的精准性 [3] - 医疗健康领域可加速新药研发和疾病诊断进程,通过共享患者信息和研究成果 [3] - 智能制造行业可优化生产调度、提高设备利用率,实现设备数据和生产流程知识的互联互通 [3] - 公共安全领域可建立统一知识图谱,实现公共安全事件、风险评估等关键信息的高效共享,提升救援效率 [3] 数据隐私与安全 - 协议要求所有知识交换消息采用加密传输技术,确保数据传输的机密性 [4] - 建立严格的访问控制体系,通过身份验证和权限管理确保敏感信息仅被授权用户访问 [4] - 对特别敏感的数据推荐采用数据脱敏技术,包括替换、匿名化等方法 [4] - 引用GB/T43697—2024等权威数据安全标准,构建全方位、多层次的数据安全防护体系 [4] 对人工智能产业链的影响 - 统一技术标准促进企业、研究机构之间的知识共享与协作,降低不同系统间的对接难度 [5] - 标准化知识描述和交换协议减少行业沟通成本,提升知识图谱产品的兼容性和互操作性 [5] - 开发者能更快掌握知识图谱核心技术,降低技术学习门槛,加快技术从研发到实际应用的转化速度 [5] 国际互联互通与未来迭代 - 协议采用国际通用的知识表示框架(如RDF、OWL)和数据交换格式(如JSON、XML),支持与国际知识图谱体系的互联互通 [6] - 有关部门正在编制国际标准协议IEEE P2807.8《知识图谱间知识融合的知识交换协议标准》 [6]
特斯联完成战略升级:三项核心业务聚焦空间智能
经济观察网· 2025-05-22 16:23
战略升级 - 公司向港交所递交更新版招股书,首次披露全新升级的三大战略板块:AIoT领域模型、AIoT基础设施、AIoT智能体,聚焦空间智能 [1] - 战略转型升级源于大模型浪潮驱动下,科技企业在GPU裸机上层搭建框架普遍需要额外投入,而公司具备软硬结合的基因,使贯通顶层模型、应用及底层基础设施的业务纵深向延展成为独特优势 [1] - 基础模型能力的不断跃迁,使得作为第三代AI核心方向的"空间智能"加速进入行业视野 [1] 业务架构 - 公司是中国AIoT行业的参与者,致力于以科技推动产业升级及空间智能以实现可持续发展,产品已获全球逾160座城市的800多个客户部署,覆盖阿联酋、新加坡、澳大利亚等国家 [2] - AIoT领域模型是公司空间智能的分析引擎,采用"多模态"及"模型+系统+应用"的商业化策略,打造专注于空间内各垂直场景的系列领域模型及智能应用 [2] - AIoT基础设施及其全栈智算产品套件是公司空间智能生态的基础,以高效能绿色智算体为核心产品 [2] - AIoT智能体作为公司空间智能解决方案的统筹交互界面,以机器人与智能穿戴设备为核心载体,作用于企业级用户级终端消费者 [3] 技术能力 - 公司推出全新升级版绿色智算体,全面支持华为昇腾、昆仑芯、寒武纪、燧源、沐曦、壁仞等信创芯片,并适配DeepSeek-R1/V3系列、Qwen系列等前沿大模型的推理和训练任务,构建具备"芯、网、云、智"能力的全链路工具包 [3] - 针对异构算力的纳管需求推出X-Stack智算云平台,提供计算虚拟化、存储虚拟化、网络虚拟化、资源池化、网络安全等服务,计算资源利用率最高可达97% [3] - 在类人思考方向,模型开创性地引入端到端强化学习方法,使用高质量数据微调训练出HALI基础模型,通过奖励函数引导模型在与工具/设备/环境的交互中不断优化策略 [4] - 在长期记忆方向,采用基于知识图谱的数据压缩存储和检索技术,使模型能够既保持超长的记忆,又能快速从历史数据中恢复记忆 [4] 财务表现 - 公司2024年年度收入为18.43亿元,相较2023年大幅提升83.2%,2022年、2023年、2024年收入分别为7.38亿元、10.06亿元及18.43亿元,三年年复合增长率达58.0% [5] - 2024年三费费用率由2023年的76.9%下降至45.0%,应收账款周转天数从2022年的238天、23年的180天进一步缩短至104天 [5] - 2024年AI产业数智化业务收入自2023年的6.24亿元大幅提升162.9%至16.4亿元,贡献了2024年业务收入的最大涨幅 [6] - 年度总客户数量由2023年的330个提升至342个,其中255个来自产业数智化业务,约占总客户数量的74.5%,截至2024年12月31日在手订单达23亿 [6] 资本动态 - 2025年1月起始,公司D++轮投资获得所得款项6.55亿元,新入股股东包含青岛汇铸、诺哲瑞英、青岛得厚、九江鄱湖、长沙经开、上海瑞力等 [6] 行业前景 - 2024年全球空间计算市场规模约为1495.9亿美元,并预计将在2034年突破10661.3亿美元,年复合增长率达21.7%,其中亚太市场年复合增长率为22.2%,高于全球平均水平 [7]
Spring 之父:我不是 Java 的“黑粉”,但我也不想再碰它!这门语言拯救了我......
猿大侠· 2025-05-22 11:29
Spring框架的诞生与发展 - Spring框架的核心理念源于Rod Johnson在1999-2000年伦敦工作期间提出的依赖注入思想,并通过其著作传播后发展为开源项目[3] - 框架成功的关键因素包括:开发者团队质量(如Juergen Hoeller)、社区专业文化、以及早期明确的商业化路径(2004年已规划可行商业模式)[5] - 与同期竞品JBoss不同,Spring通过技术创新(如解决WebSphere兼容性问题)而非单纯开源替代实现差异化[6] Kotlin语言优势与采用动因 - Kotlin具备Python的清晰可读性优势,同时规避了其类型系统弱点,并完美兼容JVM生态(如Spring/Jackson集成)[12][24] - 语言设计注重实用性:特性源自实际需求(如借鉴Scala经验但简化复杂度),避免学术化倾向[11][32] - 开发者迁移成本低:学习曲线平缓(2个月可熟练),LLM工具支持度高(代码建议质量优于Java/Python)[10][14][16] Kotlin与Spring的协同效应 - 技术契合度高:Spring的构造函数注入模式与Kotlin不可变对象特性天然匹配,XML配置已完全淘汰[24][25] - 现代Spring开发中,Kotlin能显著减少样板代码(如数据类自动注入),但JPA因可变性设计与Kotlin风格存在轻微冲突[25][26] - Spring官方文档全面支持Kotlin示例,集成问题极少(仅类默认open需适应),成熟度已达工业级标准[27] 行业生态与未来趋势 - Kotlin成功关键在JVM生态整合:与Java库互操作性近乎完美(零成本调用Spring/Jackson等),远胜Scala的历史问题[22] - 未来演进方向:需保持Java生态兼容性,可能引入联合类型等实用特性,但应避免TypeScript式的过度复杂类型系统[30][31] - 在AI开发领域,Kotlin+Spring AI组合可替代Python成为JVM系企业的生成式技术选项,提升现有技术栈利用率[34]
知识图谱与隐私计算双轮驱动 中国银联助力金融支付风险防控能力升级
经济观察报· 2025-05-20 15:26
关键技术突破 - 研发超大规模图谱网络构建和检索方法 构建十亿节点百亿边的金融交易图谱网络 实现毫秒级响应查询 [2] - 提出基于加盐哈希的匿踪查询安全方案 设计非对称加密高性能匿踪查询技术 实现跨域多方安全数据高效开放共享 [2] - 创新数据与知识混合驱动的金融欺诈违规侦测技术 解决小样本 不均衡样本场景的异常欺诈侦测难题 [2] 风险防控能力建设 - 建成金融欺诈违规智能侦测平台 构建百亿级规模金融支付交易图谱 亿级用户及商户风险画像 覆盖6个风控场景 [3] - 构建金融欺诈数据开放共享平台 通过隐私计算技术实现多方风险信息安全共享 [3] - 牵头构建隐私计算异构平台互联互通标准 在商业银行 科技公司 互联网机构实现互联互通 [3] 产业化应用成果 - 联合近40家金融机构 通信运营商开展示范应用 覆盖多种类型银行及科技企业 [4] - 技术成果有效提升欺诈识别准确率 为金融机构精准识别客户风险等级提供支撑 [4] - 未来将持续深化技术迭代 推动数据共融 模型共建 产品共研 助力金融支付风险防控基础设施建设 [4]
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
量子位· 2025-04-07 12:19
文章核心观点 - 中国科学技术大学MIRA实验室王杰教授团队提出一个创新框架KG-SFT,旨在通过引入知识图谱来提升大语言模型在特定领域的知识理解和处理能力[1] - 该框架通过生成蕴含丰富领域知识和逻辑关系的推理过程,解决了LLMs在专业领域知识理解和推理能力弱的问题[6][7] - 实验结果表明,KG-SFT在多个领域和语言的数据集上效果显著,尤其在低数据场景下性能提升明显,并成功入选ICLR 2025[2][19][20] KG-SFT框架工作机制 - 框架核心是将知识图谱与监督微调相结合,通过生成逻辑严密的推理过程解释来增强LLMs对知识和逻辑的理解[6][7] - 框架包含三个关键组件:Extractor、Generator和Detector[8][10] Extractor组件 - 负责对问答对中的实体进行识别,并从外部知识图谱中提取相关的推理子图[11] - 通过命名实体识别和多条推理路径检索,有效揭示Q&A对背后的知识关联和逻辑[12][13] Generator组件 - 利用图结构重要性评分算法对推理子图中的实体和关系进行评分,选择高分部分作为重要内容[14] - 使用大型语言模型生成逻辑清晰、流畅的解释草稿,帮助LLMs理解问题与答案间的关系[15][16] Detector组件 - 对生成的解释草稿进行句子级别的知识冲突检测,确保解释的正确性[17] - 通过自然语言推理模型和重新引导机制,标记并纠正可能存在的知识冲突,提高解释可靠性[18] 实验结果与性能 - 在低数据医学问答任务中,KG-SFT在英语场景下仅使用5%的训练数据就比传统方法提高近14%的准确率[20] - 具体数据表明,在5%训练数据下,MedQA英语准确率从26.02%提升至40.00%,MedQA中文从35.57%提升至38.83%[21] - KG-SFT可作为插件式模块与现有数据增强方法结合使用,进一步提升性能,例如与AugGPT结合在MedQA英语上从40.29%提升至40.92%[23][24] - 该方法在多个领域数据集上展现出广泛适用性,尽管在形式逻辑等复杂推理领域表现稍逊,但整体竞争力较强[24][25]