最大的开源GraphRag:知识图谱完全自主构建|港科大&华为
量子位·2025-06-12 09:37
AutoSchemaKG团队 投稿 量子位 | 公众号 QbitAI 另外,通过处理超过5000万份文档,AutoSchemaKG团队还构建了 ATLAS (自动三元组链接与模式归纳):一个 包含超过9亿节点和59亿边的知识图谱系列。 论文第一作者白佳欣是香港科技大学计算机科学与工程系的博士后研究员,受香港研究资助局新晋学者计划(JRFS)奖 项资助。 白博士的研究重点在于图神经数据库系统构建,大规模知识图谱构建和推理,检索增强生成等。他在ACL、 NeurIPS、KDD等顶级会议发表了多篇论文,工作涵盖电子商务意图建模、复杂查询回答和隐私保护神经图数据库等 前沿领域。 创新:驱动模式归纳的概念化过程 知识图谱(KGs)已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识,但目前的构建方法仍需要由 领域专家预先创建模式,这限制了KGs的可扩展性、适应性和领域覆盖范围。 为此,香港科技大学KnowComp实验室联合香港华为理论部提出了 AutoSchemaKG :一个无需预定义模式、用于 完全自主知识图谱构建的框架。 该系统利用大型语言模型,可以直接从文本中同时提取知识三元组并归纳出全面的模式,对实体和 ...