西湖大学最新Nature论文:杨剑团队构建迄今最大规模人类泛基因组,发现人类13%未知新序列
生物世界·2026-04-02 12:10

研究概述 - 西湖大学杨剑教授团队联合温州医科大学沈贤教授于2026年4月1日在《自然》杂志发表题为“The 1000 Chinese Pangenome empowers medical and population genetics”的研究 [2] - 研究创新性地开发了基于泛基因组的联合组装方法,成功构建了千人泛基因组 [2] - 该资源库是迄今为止规模最大、最全面的人类泛基因组资源库,极大突破了既往泛基因组样本量的上限 [2] 泛基因组定义 - 传统人类参考基因组主要基于欧洲白人数据构建,无法完全代表全球遗传多样性 [5] - 泛基因组是一个群体中所有基因组序列的集合,包含了该群体中存在的所有遗传变异,能更全面地反映人类基因组的真实面貌 [5] 研究背景与必要性 - 人类基因组研究长期严重依赖基于欧洲人群的参考基因组,例如人类泛基因组参考联盟项目中仅包含3个中国人样本,无法代表14亿中国人的遗传多样性 [7] - 这种依赖导致东亚人群特有的罕见遗传变异被遗漏或误判,直接影响疾病诊断准确性和药物研发针对性 [7] - 中国拥有世界上最丰富的人群遗传多样性,是理解人类演化、疾病易感性和药物反应差异的宝贵资源 [7] 核心发现与数据规模 - 研究构建了1116个中国人群的二倍体基因组组装,是目前全球最大规模的中国人群基因组资源库 [9] - 相比现有国际参考基因组,发现了4.053亿个碱基对的全新序列,这些占据人类基因组13%的序列是以前从未被记录过的“基因新大陆” [10] - 其中2620万个碱基对具有明确的功能,涉及基因编码区和调控元件 [2][10] 遗传变异解析 - 系统鉴定了3540万个小变异、11万多个结构变异、48.5万个串联重复序列以及86万个“嵌套变异” [11] - 其中33.3%的结构变异是首次被发现,其中83.5%属于罕见变异 [11] - 发现了5239个直接影响蛋白质编码基因外显子的结构变异,平均每个中国人携带450个这样的变异,其中9个是罕见变异 [12] - 鉴定出2427个串联重复扩增事件,这些与多种神经退行性疾病密切相关 [12] - 发现了735个存在结构变异的基因簇,这些基因簇在血液和免疫相关功能中显著富集 [12] 研究意义与影响 - 实现了中国在该领域从“跟跑”到“并跑”甚至“领跑”的转变,打破了20年来人类泛基因组领域国外的垄断地位 [15] - 填补精准医学空白,为中国人群的疾病风险预测、药物基因组学和个性化治疗提供了专属的遗传参考框架 [16] - 提升罕见遗传病诊断的精准性,避免因参考基因组不匹配导致的误诊漏诊 [17] - 加速新药研发,基于中国人群特异的遗传变异,可以开发更适合中国人的靶向药物 [18] - 研究团队建立了1KCP数据门户,以开放数据平台推动相关研究发展 [19]

西湖大学最新Nature论文:杨剑团队构建迄今最大规模人类泛基因组,发现人类13%未知新序列 - Reportify