Press "Enter" to skip to content

利用进化深度卷积神经网络识别全基因组RNA结合蛋白

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

编辑 | 萝卜皮

 

RNA结合蛋白(RBPs)是一组与RNA调节和代谢相关的蛋白质,在介导RNA的成熟、转运、定位和翻译中起重要作用。然而,一个 RBP 可能有多个目标 RNA,其表达缺陷会导致多种疾病,从而威胁人们的健康。

 

当前,已经开发出全基因组 RNA 结合事件检测方法来预测 RBP。然而,现有的计算方法通常存在一些局限性,例如高维、数据稀疏和模型性能低。

 

深度卷积神经网络在解决高维稀疏数据方面具有优势。为了进一步提高深度卷积神经网络的性能,吉林大学人工智能学院的研究人员,提出了进化深度卷积神经网络(EDCNN),通过将进化优化与梯度下降协同来增强深度传统神经网络来识别蛋白质-RNA的相互作用。

 

特别是,EDCNN 将进化算法和不同的梯度下降模型结合在一个互补的算法中,其中梯度下降和进化步骤可以交替优化 RNA 结合事件搜索。为了验证 EDCNN 的性能,在两个大规模 CLIP-seq 数据集上进行了实验,结果表明 EDCNN 提供了优于其他最先进方法的性能。此外,研究人员还进行了时间复杂度分析、参数分析和模体分析,以从多个角度证明了该算法的有效性。

 

该研究以「EDCNN: identification of genome-wide RNA-binding proteins using evolutionary deep convolutional neural network」为题,于 2021 年 10 月 25 日发布在《Bioinformatics》。

 

 

在这项研究中,研究人员提出了 EDCNN 算法,该算法将梯度下降方法和进化算法结合在一个框架中,以优化局部和全局 CNN 的超参数;该算法可以捕获局部和全局信息。应用各种梯度下降方法优化超参数,并使用进化算法以种群方式提高适应度。

 

 

EDCNN 的整体框架。

 

此外,重组和变异操作用于生成后代种群并发现更好的解决方案。事实上,为了增加种群的多样性,研究人员在梯度下降步骤中使用了不同的优化器。SGD、Adamax、Adam、RMSprop、Adadelta 和 Adagrad 在优化器池中的比例不同,使得所提出的模型具有特定的特征。在源自 CLIP-seq 的两个大规模数据集上进行了多次实验,结果表明,所提出的 EDCNN 提供了优于其他比较算法的优越性能,并且在识别 RNA-蛋白质结合位点方面具有很强的稳健性。

 

 

EDCNN 与其他计算方法(包括 Pre-SVM、RNAcommender、RCK、iDeepE、iCircRBP-DHN、PrismNet)在 AUC 的 47 个基准数据集上的性能比较。

 

此外,研究人员还研究了所有 RBP-24 和 RBP-47 的运行时间估计。本研究中的数值计算依赖于具有 12GB 内存的单个 NVIDIA GeForce RTX 2080 Ti GPU,整个深度网络在所有 RBP-21 和 RBP-47 数据集上的运行时间分别为 8.11 和 8.37 小时。

 

该算法已经开源,可供研究人员下载使用。

 

算法链接:https://github.com/yaweiwang1232/EDCNN

 

软件与支持数据:https://figshare.com/articles/software/EDCNN/16803217

 

论文链接:https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btab739/6409850?redirectedFrom=fulltext

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注