[发明专利]基于双随机游走重启动的多数据整合环状RNA与疾病相关性预测方法有效
申请号: | 201910711875.5 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110428899B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 雷秀娟;方增强;张宇辰 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16B30/10;G16B40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 安彦彦 |
地址: | 710119 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于双随机游走重启动的多数据整合环状RNA与疾病相关性预测方法,通过将环状RNA‑疾病关系网络转化为无向图、计算环状RNA功能注释语义相似性、结构相似性以及功能相似性,计算疾病功能以及语义相似性,将多种环状RNA相似性网络和疾病相似性网络整合成综合的环状RNA相似性网络以及疾病相似性网络,将随机游走重启动算法分别应用在整合后的环状RNA相似性网以及疾病相似性网络,避免冷启动问题,预测潜在环状RNA‑疾病关系。本发明方法能准确地预测出潜在环状RNA‑疾病关系;仿真实验结果表明,精确度、召回率、准确度、f1‑measure等指标较优;与其他关系预测方法相比,提高了环状RNA‑疾病关系的预测准确率。 | ||
搜索关键词: | 基于 随机 游走 重启动 多数 整合 环状 rna 疾病 相关性 预测 方法 | ||
【主权项】:
1.基于双随机游走重启动的多数据整合环状RNA与疾病相关性预测方法,其特征在于,包括以下步骤:(1)人类环状RNA‑疾病关系提取将环状RNA‑疾病关系网络转换成一个无向图,环状RNA‑疾病之间的关系的邻接矩阵A,A(i,j)表示环状RNA‑疾病关系邻接矩阵A中的一对环状RNA‑疾病关系实体,如果环状RNA C(i)和与疾病D(j)存在关系,则A(i,j)=1,否则A(i,j)=0;(2)构建环状RNA功能注释语义相似性网络由环状RNA的靶点基因相关基因本体数据构建环状RNA功能注释语义相似性网络,根据从人类蛋白质参考数据库下载基因对应的本体数据,再将环状RNA的靶点基因和从人类蛋白质参考数据库中处理好的基因及其对应的本体数据进行匹配,通过一种基于信息增益的方法来计算两个环状RNA之间的功能注释相似性,从而构建环状RNA功能注释语义相似度网络;(3)构建环状RNA结构相似性网络通过python的一个工具包BioPython中的Needleman‑Wunsch序列比对算法计算每对环状RNA之间的碱基序列相似性得分,为了统一相似性分数的数量级,对环状RNA的结构相似性进行归一化,最终获得环状RNA结构相似性网络;(4)构建环状RNA功能相似性网络首先通过计算环状RNA相关的一种疾病gt与一组疾病GT之间的最大相似性得分,其被定义为Smax(gt,GT),然后通过计算得出的某一疾病与全部疾病集合的最大相似性得分,计算两个环状RNA之间的功能相似性,从而构建环状RNA功能相似性网络;(5)构建疾病语义相似性网络将筛选出来的疾病在Disease Ontology数据库中进行手动匹配,将疾病名称对应为相关的DOID,其次采用名为DOSE的R包来计算每两种疾病之间的语义相似度得分,在得到每对疾病相似性得分之后进而可以构建疾病语义相似网络DSN1,疾病语义相似网络DSN1中的DSN1(i,j)表示疾病i和j的语义相似性得分;(6)构建疾病功能相似性网络在DisGeNet和人类在线孟德尔遗传数据库中下载疾病相关的基因数据,通过统计学算法JACCARD来计算疾病功能相似性,进而构建疾病功能相似网络DSN2,疾病功能相似网络DSN2中的DSN2(i,j)代表疾病i和j的功能相似性分数;(7)整合环状RNA相似性网络通过步骤(2)、(3)以及(4)构建的环状RNA功能注释语义相似网络CSN1,结构相似性网络CSN2以及功能相似性网络CSN3,整合环状RNA相似性网络:(8)整合疾病相似性网络将构建的疾病语义相似性网络DSN1和疾病功能相似性网络DSN2整合成最终的疾病相似性网络DSN;(9)通过双随机游走算法预测环状RNA‑疾病潜在关系为了给整合后的环状RNA相似性网络和疾病相似性网络中的环状RNA和疾病节点赋予一个初始的传播概率,将环状RNA相似性网络和疾病相似性网络按照列来进行标准化,NCS(i,j)和NDS(i,j)分别代表的是标准化后的环状RNA i和j之间的相似性得分以及疾病i和j的相似性得分,为了在整合后的环状RNA相似性网络和疾病相似网络中进行节点概率传播的概率转移,首先初始化整合后环状RNA相似性网络和疾病相似性网络中的环状RNA和疾病节点的转移概率,再通过分别在整合后的环状RNA相似网络和疾病相似性网络中采用随机游走算法,最后综合在环状RNA相似性网络和疾病相似性网络中的预测结果获取最终的环状RNA‑疾病关系预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910711875.5/,转载请声明来源钻瓜专利网。