DNA搜索引擎MetaGraph研发成功
科技日报·2025-10-11 07:53

技术突破 - 开发出名为MetaGraph的DNA搜索引擎,能快速高效检索公共生物学数据库中的海量信息 [1] - 核心突破在于采用数学中的“图结构”,将相互重叠的DNA片段智能联结,原理类似于图书索引中的知识网络 [1] - 整合7个公共资助数据库,构建出跨越病毒、细菌、真菌、植物、动物乃至人类的生命全谱系索引 [1] 数据规模 - 构建的索引涵盖1880万个独特的DNA与RNA序列集,以及2100亿个氨基酸序列集 [1] - 搜索引擎可直接对“序列读取档案”(SRA)等存储库提出生物学问题,该数据库本身包含超过1亿个DNA字母 [2] 应用效能 - 提供与生物学数据交互的全新方式,数据被高度压缩却可随时调取 [2] - 验证实验中,利用MetaGraph扫描24万多个人类肠道微生物组样本搜寻抗生素耐药性遗传标记,仅用一台高性能计算机约一小时便得出结果 [2] 行业评价 - 法国巴斯德研究所生物计算专家评价称,这是一项“重大突破”,为分析DNA、RNA及蛋白质序列等原始生物学数据设立了新标准 [2]