[发明专利]基于集成的相似性度量和双向随机游走的药物重定位方法有效
申请号: | 201510991455.9 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105653846B | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 罗慧敏;夏红;王建新;罗军伟 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F19/10 | 分类号: | G06F19/10 |
代理公司: | 长沙市融智专利事务所 43114 | 代理人: | 黄美成 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于集成的相似性度量和双向随机游走的药物重定位方法,集成相似性度量方法在计算药物相似性、疾病相似性时,除了分别利用药物特性信息与疾病特性信息,还充分考虑了当前数据集中已知药物‑疾病关联信息对相似性度量的作用,使得所计算的相似性值能够更好的反映药物间的相似度和疾病间的相似度。在此基础上,构建了药物‑疾病异构网络,基于该异构网络,采用双向随机游走算法为所有的药物预测候选疾病。本发明简单有效,通过与其他方法比较,及在多个数据集上测试表明,该发明在药物重定位方面具有较好的预测性能。 | ||
搜索关键词: | 基于 集成 相似性 度量 双向 随机 游走 药物 定位 方法 | ||
【主权项】:
1.一种基于集成的相似性度量和双向随机游走的药物重定位方法,其特征在于,包括以下步骤:步骤1:基于相似性计算创建相似性矩阵;计算药物相似性以及疾病相似性,从而创建药物相似性矩阵和疾病相似性矩阵;步骤2:基于相似性矩阵以及药物‑疾病关联特性以构建药物‑疾病异构网络;步骤3:在药物‑疾病异构网络上基于双向随机游走算法进行药物重定位;所述步骤1中,药物相似性的计算方法如下:1)采用分子指纹比较计算药物的化合物相似性;2)对化合物相似性进行调整:(a)把0到1之间区间平均分为N个区间,统计药物对相似性值在各区间范围内的药物对个数,N为大于5的整数;并计算各区间范围内的存在共享疾病的药物对比例;(b)然后利用Fisher‑Yates乱序算法打乱所有药物对的相似性值,得到随机的药物相似性,再次统计相似性值在各区间范围内的存在共享疾病的药物对比例;比较步骤(a)与该步骤的结果,发现在相似性值小于某个值的药物对中,共享疾病的药物对比例小于随机情况下的比例,将这个值定义为阈值LSim;在相似性值大于某个值的药物对中,共享疾病的药物对比例高于随机情况下的比例,将这个值定义为阈值HSim;(c)根据(b)中得到的阈值,采用以下公式调整相似性值;
x表示要调整的化学结构相似性值,c、d参数是逻辑函数的可调参数;c、d参数的设置方法为:设置L(0)=0.0001,通过
计算出参数d的值为log(9999),log以e为底数;设置L(Lsim)=0.01,并基于d值,通过
计算出参数c的值;(d)基于药物‑疾病关联信息修正药物对的相似性值:首先基于所有药物之间的共享关联,创建药物共享网络,SR={r1,r2,…,rm}表示m个药物结点,用药物之间共享疾病数表示药物节点之间的边权值;然后用ClusterOne聚类算法对该药物共享网络进行聚类,得到多个药物模块,在同一个模块内的药物直接共享或间接共享疾病;采用在原药物对的相似性值的基础上乘以系数1+QC对相似性值进行修正;
其中,f(V)表示模块的内聚性,V表示一个模块内的节点集合,win(V)表示模块内所有边权值和,wbound(V)表示该模块的所有节点与该模块外的节点连接的边权值和,p|V|表示惩罚项;所述步骤1中,疾病相似性的计算方法如下:首先,基于疾病表型信息计算疾病表型相似性;然后,计算分析疾病间表型相似性与疾病间是否存在共享药物的相关性,根据计算分析结果,调整药物化学结构相似性和疾病表型相似性,得到新的药物相似性和疾病相似性;最后,根据疾病间的共享药物信息,对疾病进行聚类,识别疾病模块,提高属于同一模块的疾病间相似性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510991455.9/,转载请声明来源钻瓜专利网。
- 上一篇:基于三维成像的脉搏波图像采集与存储方法
- 下一篇:近场通信移动医疗服务系统
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用