Workflow
ACEP分析框架
icon
搜索文档
【新华社】科研团队成功利用人工智能蛋白语言模型揭示生命演化奥秘
新华社· 2025-10-08 20:17
研究核心观点 - 研究揭示了蛋白质“高阶特征”趋同是生物适应性演化的重要机制,突破了传统方法仅关注氨基酸位点趋同的局限 [1][6] - 研究团队成功利用人工智能领域的蛋白语言模型,开发出名为“ACEP”的计算分析框架,以解析蛋白高阶特征在功能适应性趋同演化中的关键作用 [2][4] - 该研究深化了对生命演化规律的认识,展示了人工智能技术在解析复杂生物问题方面的强大潜力,并推动了演化生物学研究范式的转变 [6] 研究方法与创新 - 提出的ACEP分析框架核心创新在于利用预训练蛋白语言模型,将蛋白序列转化为包含丰富演化信息的高维嵌入向量 [2][4] - 蛋白语言模型在海量蛋白序列数据上进行预训练,能够捕捉序列中复杂的上下文信息和高阶特征,理解氨基酸序列背后更深层次的蛋白结构功能特征和规律 [2][4] - ACEP分析流程包括三个关键步骤:计算目标类群同源蛋白嵌入向量的真实距离、通过模拟中性演化过程构建背景距离分布、基于分布对真实距离进行统计检验 [4] 研究验证与发现 - 在已知的经典案例中,如在回声定位哺乳动物的Prestin蛋白和景天酸代谢植物的PEPC/PPCK蛋白上,ACEP均检测到了显著的高阶特征趋同信号 [5] - 全基因组筛选结果显示,ACEP在蝙蝠与齿鲸中识别出数百个具有趋同信号的候选基因,功能富集分析表明部分基因显著关联“感官感知”等与回声定位密切相关的功能条目 [5] - 发现的候选基因不仅包含已知的回声定位基因,还包括多个新候选基因,部分候选基因还得到了正选择检验的支持 [5] 研究影响与意义 - 该研究为在全基因组水平系统挖掘基因的复杂适应性趋同模式提供了新工具,为理解生物适应性演化的分子基础开辟了新方向 [6] - 研究成果对生物医学、生态学等领域也具有重要的启示意义 [6] - ACEP分析框架的代码已在HuggingFace平台开源共享,供全球科研界使用 [6]