PlantLncBoost模型

搜索文档
整合多源植物转录组数据,山东理工大学等构建PlantLncBoost模型,跨物种lncRNA预测准确率最高达96%
36氪· 2025-06-18 15:44
山东理工大学联合北京林业大学、广东省农业科学院、巴西圣保罗大学、英国罗莎琳德富兰克林医科大学、瑞典于默奥大学的研究团队等科研机构,共同 构建了 PlantLncBoost 模型,为解决植物 lncRNA 鉴定的泛化性难题提供了系统性解决方案。 在植物科学领域,长非编码 RNA(lncRNA)的研究正逐渐成为焦点。2020 年发表的一篇关于植物 lncRNA 研究的论文指出,lncRNA 在植物的生长发育 和环境适应过程中发挥着关键作用。例如,有研究发现,某些 lncRNA 能够通过与蛋白质相互作用来调控植物的开花时间,从而影响植物的繁殖策略。这 种精细的调控机制对于理解植物如何应对气候变化等环境压力具有重要意义。 随着技术的进步,越来越多的植物 lncRNA 被鉴定并表征。然而,由于 lncRNA 在不同物种之间的序列保守性较差,为机器学习模型的泛化能力带来了重 大挑战。以早期广泛应用的 CPC 和 CPAT 工具为例,其在禾本科与豆科植物间的交叉验证准确率较同源物种下降 35%-40%,暴露出序列特征泛化能力不 足的核心问题。尽管提升模型(如 XGBoost、LightGBM)在处理高维数据时表现出更好的抗 ...