AlphaCD

搜索文档
设计基因编辑工具的AI大模型问世
科技日报· 2025-08-28 08:08
基于该数据库,团队整合蛋白质序列、三维结构、理化性质等多模态数据,开发出AlphaCD。经严格验 证,AlphaCD在预测胞嘧啶脱氨酶催化效率、脱靶活性、靶向窗口及基序偏好等关键指标时,准确性显 著优于传统方法。 "AlphaCD突破了当前AI大模型依赖超算资源的局限。"左二伟介绍,研究团队采用随机森林算法发现, 在个人计算机上即可完成模型训练。这一轻量化设计能让学术机构低成本开展高通量功能预测。 (文章来源:科技日报) 记者27日从中国农业科学院获悉,该院农业基因组研究所农业基因编辑技术研发与应用创新团队构建了 全球规模最大的实验验证数据集,并基于此开发出人工智能(AI)大模型AlphaCD。该模型不仅能高效 预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能碱基编辑工具。相关成果日前发表 于国际期刊《细胞研究》。 胞嘧啶碱基编辑器是一种基因编辑工具,广泛应用于疾病治疗、动植物育种等研究领域。"但传统胞嘧 啶碱基编辑器研发依赖大量试错实验,成本高、周期长,且难以系统优化酶活特征。"论文通讯作者、 中国农业科学院农业基因组研究所研究员左二伟说。 为破解这一难题,研究团队历时3年,实验测试了1100种 ...
Cell Res:左二伟团队开发AI模型——AlphaCD,高精度表征胞嘧啶脱氨酶
生物世界· 2025-08-18 16:30
基因组学与蛋白质功能研究 - 基因组学快速发展带来大量新蛋白质探索机会 但传统生化实验方法存在耗时费力且难以规模化的问题 [3] - 蛋白质一级序列分析可识别功能基序和保守结构域 序列比对能揭示功能参考价值的同源蛋白质 [3] - AlphaFold2推动基于结构同源性的聚类方法应用 但仍无法全面评估多功能复杂蛋白质 [3] AlphaCD机器学习模型 - 中国农业科学院团队开发AlphaCD模型 可高精度预测21335个胞嘧啶脱氨酶的催化效率(0 92) 脱靶活性(0 84) 靶位点窗口(0 73)和催化基序(0 78) [4][6] - 模型基于1100个APOBEC样家族胞嘧啶脱氨酶的实验数据集 结合氨基酸序列 三维结构和8个附加特征构建 [6] - 对Uniprot数据库21335个胞嘧啶脱氨酶的预测验证显示 子抽样28个酶的预测精度达0 84-0 87 [6] 碱基编辑器应用 - 通过丙氨酸扫描诱变技术优化A0A2R2Z4E4脱靶位点 构建出兼具超高保真度与高效率的胞嘧啶碱基编辑器(CBE) [8] - 该案例证明AlphaCD在高通量蛋白质功能表征中的应用价值 为其他蛋白质功能解析提供策略范式 [8]