Workflow
DNA搜索引擎MetaGraph研发成功
科技日报·2025-10-11 07:53

为验证其实用性,团队利用MetaGraph扫描了24万多个人类肠道微生物组样本,搜寻抗生素耐药性的遗 传标记。仅用一台高性能计算机,约一小时便得出结果,展现出强大的分析效率。 法国巴斯德研究所生物计算专家拉扬·希基评价称,这是一项"重大突破",为分析DNA、RNA及蛋白质 序列等原始生物学数据设立了新标准。 (文章来源:科技日报) MetaGraph的核心突破在于采用数学中的"图结构",将相互重叠的DNA片段智能联结。其原理类似于图 书索引中将含有相同关键词的句子关联起来,形成知识网络。研究团队整合了7个公共资助数据库,构 建出一个跨越病毒、细菌、真菌、植物、动物乃至人类的生命全谱系索引。该索引共涵盖1880万个独特 的DNA与RNA序列集,以及2100亿个氨基酸序列集。 基于这一庞大索引,团队开发出了可直接通过文本提示检索原始数据档案的搜索引擎。团队表示,这是 一种与生物学数据交互的全新方式——数据被高度压缩,却可随时调取。MetaGraph使研究人员能直接 对"序列读取档案"(SRA)等存储库提出生物学问题,该数据库本身包含超过1亿个DNA字母。 瑞士苏黎世联邦理工学院科学家在最新一期《自然》杂志上发表论 ...