[发明专利]一种LncRNA和环境因素关联关系的高效预测方法在审
申请号: | 201911151918.5 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110942803A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 邝祝芳;汪茄琪;韩跟伟;马志豪 | 申请(专利权)人: | 中南林业科技大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410004 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 lncrna 环境 因素 关联 关系 高效 预测 方法 | ||
1.一种LncRNA和环境因素关联关系的高效预测方法,其特征在于,包括以下步骤:
步骤1:从公开数据库DLREFD(网址:
步骤2:利用公开的SimComp工具(网址:Similar Compound,
步骤3:将KL进行逻辑斯蒂(logistic)函数转换,得到LncRNA相似矩阵SL;利用环境因素之间的化学结构相似性矩阵E、环境因素的高斯相互作用属性核相似矩阵KE,构建环境因素的相似矩阵SE。
步骤4:融合LncRNA-环境因素关联关系网络的关联矩阵A、LncRNA的相似矩阵SL和环境因素的相似矩阵SE三个子网,构建一个全局异构网络;在异构网络上,利用重启随机游走算法得到扩散特征。使用奇异值分解(SVD)对扩散特征进行降维。
步骤5:计算异构网络上lncRNA-环境因素对的Hetesim得分。
步骤6:结合扩散特征和HeteSim得分得到特征数据集,将得到的特征数据用于训练梯度提升树(GBDT)分类器,该分类器用于预测LncRNA-环境因素的关联关系。
步骤7:使用10折交叉验证进行验证。
2.根据权利要求1所述的LncRNA和环境因素关联关系的高效预测方法,其特征在于,步骤1中LncRNA-环境因素关联关系网络的关联矩阵A,LncRNA的高斯相互作用属性核相似矩阵KL和环境因素的高斯相互作用属性核相似矩阵KE的步骤如下:
利用公开数据库DLREFD下载的已知的LncRNA-环境因素关联关系,构建LncRNA-环境因素关联的关联矩阵A,如果LncRNA-环境因素存在关联,则A中对应元素为1,反之为0。构建LncRNA的高斯相互作用属性核相似矩阵KL,计算每个LncRNA对,即LncRNA li和LncRNA lj之间的高斯相互作用属性核相似性;同样地,基于功能相似的LncRNA与相似的环境因素之间具有关联关系的假设,利用已知的LncRNA-环境因素关联关系网络,构建环境因素的高斯相互作用属性核相似矩阵KE。
3.根据权利要求1所述的LncRNA和环境因素关联关系的高效预测方法,其特征在于,步骤2中利用公开的SimComp工具计算环境因素之间的化学结构相似性矩阵E。以数据库DLREFD中的环境因素对应的KEGG数据库入口编号作为参数,使用SimComp工具计算这些环境因素之间的化学结构相似分数。通过调用SimComp的API计算每一对环境因素ei和环境因素ej的化学结构相似分数E(ei,ej)。
4.根据权利要求1所述的LncRNA和环境因素关联关系的高效预测方法,其特征在于,步骤3中将KL进行逻辑斯蒂(logistic)函数转换,得到的LncRNA相似矩阵SL;利用环境因素之间的化学结构相似性矩阵E、环境因素的高斯相互作用属性核相似矩阵KE,构建环境因素的相似矩阵SE。
5.根据权利要求1所述的LncRNA和环境因素关联关系的高效预测方法,其特征在于,步骤4中融合LncRNA-环境因素关联关系网络的关联矩阵A、LncRNA的相似矩阵SL和环境因素的相似矩阵SE三个子网,构建一个全局异构网络;在异构网络上,利用重启随机游走算法计算扩散分数,得到高维扩散特征,再使用奇异值分解(SVD)进行降维得到d维的低维扩散特征。具体步骤为:第一步:构建游走网络。第二步:在新建的游走网络上实现随机游走,获得稳定的随机游走概率,得到扩散特征。第三步:使用奇异值分解(SVD)对扩散特征进行降维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南林业科技大学,未经中南林业科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911151918.5/1.html,转载请声明来源钻瓜专利网。