[发明专利]一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法有效
申请号: | 201910664021.6 | 申请日: | 2019-07-23 |
公开(公告)号: | CN110491443B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 蒋兴鹏;马英钧;吴倩 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00;G06F17/16;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 投影 邻域 矩阵 分解 lncrna 蛋白质 关联 预测 方法 | ||
1.一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法,其特征在于,包括:
步骤S1:获取已知的lncRNA序列、lncRNA表达谱数据、蛋白质序列、蛋白质DO功能注释以及lncRNA和蛋白质的关联矩阵;
步骤S2:根据已知的lncRNA序列、lncRNA表达谱数据、蛋白质序列、蛋白质DO功能注释以及lncRNA和蛋白质的关联矩阵,计算多种lncRNA特征矩阵、蛋白质特征矩阵、lncRNA相似矩阵和蛋白质相似矩阵,并对已知的lncRNA和蛋白质的关联矩阵进行补全,其中,lncRNA特征矩阵用以表示lncRNA的特征,蛋白质特征矩阵用以表示蛋白质的特征,lncRNA相似矩阵用以表示lncRNA的相似性,蛋白质相似矩阵用以表示蛋白质的相似性;
步骤S3:将多种lncRNA相似矩阵进行融合,获得融合后的lncRNA相似矩阵,将多种蛋白质相似矩阵进行融合,获得融合后的蛋白质相似矩阵;
步骤S4:分别计算融合后的lncRNA相似矩阵的第一邻域相似矩阵以及融合后的蛋白质相似矩阵的第二邻域相似矩阵,其中,第一邻域相似矩阵用以表示符合预设条件的lncRNA的相似性,第二邻域相似矩阵用以表示符合预设条件的蛋白质的相似性;
步骤S5:结合补全后的lncRNA和蛋白质的关联矩阵、多种lncRNA特征矩阵、多种蛋白质特征矩阵、第一邻域相似矩阵以及第二邻域相似矩阵,利用特征投影的邻域非负矩阵分解算法来计算获得lncRNA的第一潜在子空间特征矩阵和蛋白质的第二潜在子空间特征矩阵;
步骤S6:基于第一潜在子空间特征矩阵和第二潜在子空间特征矩阵,计算lncRNA和蛋白质的关联性;
其中,步骤S5通过下述方式计算lncRNA的第一潜在子空间特征矩阵和蛋白质的第二潜在子空间特征矩阵:
其中,表示lncRNA的N1种特征,表示蛋白质的N2种特征,表示lncRNA的与对应的N1种投影矩阵,表示蛋白质与对应的N2种投影矩阵,为重要性水平分配矩阵,若当前lncRNA li和蛋白质pj间存在交互,Ci,j=δ,反之,Ci,j=1,其中δ1是重要水平参数;和表示投影权重参数,η1表示投影指数参数;为lncRNA的拉普拉斯矩阵;对角矩阵其对角线元素分别为为蛋白质的拉普拉斯矩阵;对角矩阵其对角线元素分别为tr(·)表示矩阵的迹,λ为邻域拉普拉斯正则化参数;μ是投影矩阵的正则化参数,‖·‖1,2表示矩阵的1,2范数,‖·‖F表示F范数,γ表示潜在子空间正则化参数。
2.如权利要求1所述的方法,其特征在于,步骤S2中对已知的lncRNA和蛋白质的关联矩阵进行补全,具体包括:
步骤S2.1:对已知的lncRNA蛋白质的关联矩阵按照行分解,利用lncRNA相似矩阵对按行分解后的矩阵进行补全;
步骤S2.2:对已知的lncRNA蛋白质的关联矩阵按照列分解,利用蛋白质相似矩阵对按列分解后的矩阵进行补全;
步骤S2.3:对步骤S2.1中补全后的矩阵和步骤S2.2中补全后的矩阵求平均值,得到补全后的lncRNA和蛋白质的关联矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910664021.6/1.html,转载请声明来源钻瓜专利网。