CRISmers
搜索文档
Nature Biotechnology:王宇团队等利用生成式AI,实现RNA适配体的一轮式高效进化
生物世界· 2026-02-08 16:30
文章核心观点 - 中国科学院深圳先进技术研究院王宇团队开发了一个名为GRAPE-LM的生成式人工智能框架,该框架结合了条件自编码器与核酸语言模型,并由基于CRISPR-Cas的胞内筛选数据引导,实现了RNA适配体的单轮高效进化,将传统方法所需的6-16轮筛选缩减至一轮,并将初始文库规模需求降低了百万至亿分之一[2][3][7][8] 技术突破:GRAPE-LM框架 - GRAPE-LM是一个用于RNA适配体一轮式高效进化的生成式人工智能框架,全称为Generator of RNA Aptamers Powered by activity-guided Evolution and Language Model[3] - 该框架以Transformer条件自编码器为骨架,融合了核酸语言模型,并由CRISmers在胞内环境产生的筛选数据提供“活性引导”[7] - 该框架将“实验进化”重构为“物理进化+数字优化”的两阶段:第一阶段由CRISmers在细胞内完成一轮筛选,第二阶段由语言模型在更大序列空间中进行数字化优化与外推[8] 技术背景与瓶颈 - 传统的核酸适配体发现长期依赖指数富集的配体系统进化技术,通常需要多轮、强人工参与的筛选与优化,且在体外简化条件下获得的适配体亲和力和特异性常常不高[5] - 王宇课题组此前开发的CRISmers系统将适配体筛选推进到细胞内环境,提升了生物学相关性,但受限于递送效率与细胞摄入能力,文库规模存在通量上限,可能错过大量潜在有效序列[6][7] 验证结果与效率跃迁 - GRAPE-LM框架在三类跨度显著的靶标上完成验证:人T细胞受体CD3ε、SARS-CoV-2刺突蛋白的RBD,以及人源致癌转录因子c-Myc[8] - 在三类靶标上,仅用“一轮”筛选即可获得优于既往SELEX技术6–16轮所得到的适配体的先导序列[8] - CRISmers+GRAPE-LM路线可在约10^8规模的起始文库上工作,而经典SELEX常需要10^14–10^16量级;前者仅需后者约百万分之一到亿分之一的初始文库规模[8] 技术范式与价值 - 在新范式中,CRISPR扮演“高保真胞内RNA数据发动机”的角色,捕获体外方法难以复现的胞内内源生物学机制;而GRAPE-LM则通过外推有限起始文库,补足CRISmers通量受限的短板,并引导生成更高活性RNA适配体[9] - 该技术路线也已成功用于多肽分子的高效发现,并与某知名药企合作开展药物开发[12] - 核酸适配体领域开创者Jack Szostak评价该工作“非常有创造性,令人印象深刻”,论文审稿人评价为“超级创新”,并被Nature Biotechnology编辑团队选为亮点论文[12]