[发明专利]一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法有效
申请号: | 201910664021.6 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110491443B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 蒋兴鹏;马英钧;吴倩 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00;G06F17/16;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 投影 邻域 矩阵 分解 lncrna 蛋白质 关联 预测 方法 | ||
本发明公开了一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法,首先,根据lncRNA序列、lncRNA表达谱数据、蛋白质序列、蛋白质的GO功能注释数据以及lncRNA和蛋白质的交互网络,计算得到多种lncRNA特征、蛋白质特征、lncRNA相似矩阵和蛋白质相似矩阵。其次,将多种lncRNA相似网络进行融合得到整合的lncRNA相似网络,将多种蛋白质相似网络进行融合得到整合的蛋白质相似网络。最后,结合整合的lncRNA(蛋白质)相似网络和多种lncRNA(蛋白质)特征,提出了一种特征投影的邻域非负矩阵分解算法来预测lncRNA蛋白质的潜在交互。本发明不仅能准确的预测新的lncRNA蛋白质交互,同时还可以预测没有关联任何lncRNA(蛋白质)的新的蛋白质(lncRNA),有效的避免了生物化学实验导致的高人力物力消耗。
技术领域
本发明涉及生物信息学技术领域,具体涉及一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法。
背景技术
随着测序技术的不断发展,我们将一步步揭开生物基因组神秘的面纱,弄清RNA世界成为了当今生物学面临的最重要的挑战之一。占据转录组高达98%的非编码RNA是潜在的新生物标记物和蛋白质靶标的宝矿,其中长度没有超过200个核苷酸的非编码RNA被称为长非编码RNA(lncRNA)。
lncRNA在各种生物进程中都发挥着重要的作用,其参与调控基因表达,影响核结构域的形成,通过直接机制调控染色体结构。几乎所有的lncRNA的功能都能够通过与其相应的RNA结合蛋白的相互作用中有所表现,所以lncRNA和蛋白质的相互作用会极大地影响基因表达调控的复杂度和灵活度。利用实验手段探测大规模的lncRNA-蛋白质交互耗时且昂贵,因此目前一些预测lncRNA-蛋白质交互的计算模型被陆续提出。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
对于lncRNA-蛋白质的交互预测,大部分方法仍使用监督学习进行分析计算。使用监督学习算法进行预测的关键在于如何尽可能构建均衡的正负样本,但是目前对于负样本仍没有较好的方法去构建。其次是目前大多数已有的算法都无法适用于对新的lncRNA和新的蛋白质预测。再者,已有方法的预测准确率距离可实践还有一定的距离,合理利用lncRNA和蛋白质的网络拓扑结构可以很大程度上提升模型的预测性能。
由此可知,现有技术中的方法存在预测准确性不高的技术问题。
发明内容
有鉴于此,本发明提供了一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法,用以解决或者至少部分解决现有技术中的方法存在的预测准确性不高的技术问题。
本发明提供了一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法,包括:
步骤S1:获取已知的lncRNA序列、lncRNA表达谱数据、蛋白质序列、蛋白质DO功能注释以及lncRNA和蛋白质的关联矩阵;
步骤S2:根据已知的lncRNA序列、lncRNA表达谱数据、蛋白质序列、蛋白质DO功能注释以及lncRNA和蛋白质的关联矩阵,计算多种lncRNA特征矩阵、蛋白质特征矩阵、lncRNA相似矩阵和蛋白质相似矩阵,并对已知的lncRNA和蛋白质的关联矩阵进行补全,其中,lncRNA特征矩阵用以表示lncRNA的特征,蛋白质特征矩阵用以表示蛋白质的特征,lncRNA相似矩阵用以表示lncRNA的相似性,蛋白质相似矩阵用以表示蛋白质的相似性;
步骤S3:将多种lncRNA相似矩阵进行融合,获得融合后的lncRNA相似矩阵,将多种蛋白质相似矩阵进行融合,获得融合后的蛋白质相似矩阵;
步骤S4:分别计算融合后的lncRNA相似矩阵的第一邻域相似矩阵以及融合后的蛋白质相似矩阵的第二邻域相似矩阵,其中,第一邻域相似矩阵用以表示符合预设条件的lncRNA的相似性,第二邻域相似矩阵用以表示符合预设条件的蛋白质的相似性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910664021.6/2.html,转载请声明来源钻瓜专利网。