[发明专利]基于深度学习的非编码RNA与疾病之间关联的预测方法有效
申请号: | 201810833752.4 | 申请日: | 2018-07-26 |
公开(公告)号: | CN109147936B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 刘滨;魏航 | 申请(专利权)人: | 刘滨 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06N3/04;G16B40/00 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡吉科 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 编码 rna 疾病 之间 关联 预测 方法 | ||
1.一种基于深度学习的非编码RNA与疾病之间关联的预测方法,其特征在于:所述方法包括以下步骤:
S1、对L个长非编码RNA计算其不同层次的相似矩阵,所述不同层次的相似矩阵包括基于长非编码RNA的序列信息求得其相似矩阵SL1、基于已知的长非编码RNA与疾病的交互谱信息求得其相似矩阵SL2、基于长非编码RNA的组织表达数据求得其相似矩阵SL3;基于长非编码RNA与微小RNA的交互信息,求得其相似矩阵SL4;对D个疾病计算其不同层次的相似矩阵,所述不同层次的相似矩阵包括基于疾病的语义信息,求得其相似矩阵SD1、基于已知的疾病与长非编码RNA的交互谱信息求得其相似矩阵SD2、基于疾病与微小RNA的交互信息求得其相似矩阵SD3;
S2、针对长非编码RNA与疾病关联对,构建其关联特征矩阵T;每一个长非编码RNA与疾病的关联对可得到12个关联特征矩阵T;
S3、构造样本数据,其中,正样本为所有已知关联的长非编码RNA与疾病对,负样本在未知关联对中随机挑选3倍于正样本数目的长非编码RNA与疾病对;针对特定的关联对样本,其得到的12个特征矩阵看作是该关联对样本的12个通道数据;基于以上样本数据,构建5层卷积神经网络和两层全连接网络进行训练,逐层卷积神经网络的学习过程为对12个通道数据的特征融合过程,可将初始低层次关联特征不断整合为最终的高层次关联特征;
S4、针对未知关联的非编码RNA和疾病对,利用步骤S1、S2构建其12层关联特征,利用步骤S3学习得到的网络模型对该未知关联的非编码RNA与疾病对进行关联程度预测,预测关联得分越高表征该非编码RNA与特定疾病具有关联的可能性越大。
2.根据权利要求1所述的方法,其特征在于:所述步骤S1中,基于长非编码RNA的序列信息,利用Smith-Waterman序列比对方法,求得其相似矩阵SL1;基于已知的长非编码RNA与疾病的交互谱信息,利用高斯核交互谱统计方法,求得其相似矩阵SL2;基于长非编码RNA的组织表达数据,利用spearman相关系数计算方法求得其相似矩阵SL3;基于长非编码RNA与微小RNA的交互信息,利用Fisher精确检验统计方法,求得其相似矩阵SL4。
3.根据权利要求2所述的方法,其特征在于:不同层次量化得到的长非编码RNA相似矩阵SL1、SL2、SL3、SL4均为L×L维的矩阵,具体形式如下:
其中k={1,2,3,4},rk,i,j表示第k个层次的长非编码RNA相似矩阵中第i个长非编码RNA与第j个长非编码RNA的相似程度值。
4.根据权利要求1所述的方法,其特征在于:所述步骤S1中,基于疾病的语义信息,利用最优匹配方法,求得其相似矩阵SD1;基于已知的疾病与长非编码RNA的交互谱信息,利用高斯核交互谱统计方法,求得其相似矩阵SD2;基于疾病与微小RNA的交互信息,利用Fisher精确检验统计方法,求得其相似矩阵SD3。
5.根据权利要求4所述的方法,其特征在于:不同层次量化得到的疾病相似矩阵SD1、SD2、SD3均为D×D维的矩阵,具体形式如下:
其中n={1,2,3},tn,i,j表示第n个层次疾病相似矩阵中第i个疾病与第j个疾病之间的相似程度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘滨,未经刘滨许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810833752.4/1.html,转载请声明来源钻瓜专利网。