RNA结合蛋白(RBP,RNA Binding Protein)是普遍存在的能与RNA结合的蛋白质的总称。RBP通过与RNA特异性结合,直接或间接地调控RNA的表达,RBP结合研究是目前生物医学领域的重要研究课题。现阶段研究中,由于人们对RBP相互结合机制以及结合特性尚未完全了解,使得传统机器学习方法提取特征较为困难,目前尚未出现公认的特征提取方法。因此,越来越多的目光转向深度学习方法。然而,深度学习预测方法仍存在以下不足:1.大多数深度学习方法仅考虑序列信息,忽略了二级结构信息。2.大多数预测模型只能考虑浅层的一维特征信息,忽略了深Elexacaftor生产商层次的拓扑信息和节点特征信息。针对上述问题,从数据特征和网络模型两方面入手,提出一种结合位置特征的RBP结合预测新模型,全文工作主要包括两方面。首先,针对现有生物特征信息提取方法单一的问题,构建了RNA序列和结构信息的特征矩阵。通过序列相似性聚类进行RNA数据集特性异性筛选,采用自然语言处理(NLP,Natu寻找更多ral Language Processing)编码方式提取序列核苷酸的局部信息,采用RNAfold来获取核苷酸拓扑空间自由能信息。编码特征组合后,序列滑动窗口和结构碱基自由能被分别表示为可直接读取的数据张量。其次,针对现有网络预测模型准确率较低的问题,搭建一种基于序列和结构特征的深度学习预测模型Deep PG(Deep Power Graph)。在训练阶段,模型通过(CNN,Convolutional Neural Networks)提取序列核苷酸的相邻特征,通过(GCN,Graph Convolutional Networks)Genetic-algorithm (GA)提取核苷酸的拓扑特征,最后通过线性组合将学习到的加权表示输入到分类器中以预测RBP的相互结合。最后,基于上述研究设计分析验证实验,并在公共数据集上对所提方法进行验证。对比现有研究,论文所提方法可实现预测精度的提升(平均AUC可达到87.6%)。为了进一步验证引入拓扑信息及网络模型的有效性,进行结合贡献分析实验。实验表明,融合结构数据模型的平均AUC提高1.4%。此外,为了解决预测过程数据可视工作较为单一问题,通过新的数据可视化分析方案让相关科研人员从实验过程、结果等方面综合观测数据之间的联系。