Workflow
微蛋白研究
icon
搜索文档
AI新工具探索“被忽视的DNA区域”
科技日报· 2025-08-01 07:54
基因组研究技术突破 - 美国索尔克研究所开发出名为ShortStop的机器学习框架 用于探索被忽视的DNA区域并寻找疾病相关的微蛋白 相关研究发表在《BMC方法学》[1] - 微蛋白是组成氨基酸少于150个的小型蛋白质 传统方法难以检测 长期隐藏在基因组99%被视为"非编码"或"垃圾DNA"的区域中[1] - 越来越多证据表明这些微蛋白在调节健康与疾病过程中扮演重要角色 但传统研究方法主要关注编码大型蛋白质的DNA区域[1] AI工具技术优势 - ShortStop通过机器学习训练 能从大型基因数据库识别潜在smORF并预测具有生物学相关性的微蛋白 显著提高研究效率[2] - 采用双类别排序系统 通过比较真实smORF与计算机生成的随机"诱饵"序列 快速评估新发现smORF的功能性[2] - 团队应用ShortStop发现约8%的序列可能编码功能性微蛋白 并识别出以往方法遗漏的在人体细胞和组织中实际表达的微蛋白种类[2] 实际应用成果 - ShortStop可直接利用广泛存在的RNA测序数据 使许多实验室无需额外实验即可开展微蛋白研究[2] - 在肺癌相关遗传数据分析中 从肿瘤与正常肺组织对比识别出210种全新微蛋白候选者 其中一种在肿瘤组织中显著升高[2] - 该显著升高的微蛋白显示出作为肺癌生物标志物或治疗靶点的巨大潜力 验证了工具在疾病研究中的实用性[2]