[发明专利]一种基于多特征融合的药物副作用预测方法有效
申请号: | 201710323917.9 | 申请日: | 2017-05-05 |
公开(公告)号: | CN106960131A | 公开(公告)日: | 2017-07-18 |
发明(设计)人: | 江振然;牛舒媛;毛晓丹;罗剑;刘明耀 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙)31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多特征融合的药物副作用预测方法,该方法基于药物的四种属性,使用多标签集成K近邻方法预测药物副作用。大规模的副作用数据实验结果表明,该方法不仅预测精度高,鲁棒性好,而且可以成功预测出一些药物在上市以后才表现出的副作用。该方法可用于药物副作用安全性评估及临床患者用药参考等用途。 | ||
搜索关键词: | 一种 基于 特征 融合 药物 副作用 预测 方法 | ||
【主权项】:
一种基于多特征融合的药物副作用预测方法,其特征在于,该预测方法包括以下具体步骤:步骤1:构建药物特征矩阵A1:计算药物的化学特性相似性所述化学特性相似性为基于药物化学子结构的相似性,化学子结构从PubChem数据库中获得,然后使用式(1)来计算任意两个药物之间的化学特性相似性,得到化学特性相似性矩阵sc;sc(di,dj)=structure(di)∩structure(dj)structure(di)∪structure(dj)---(1)]]>式(1)为药物di和dj之间的化学特性相似性的计算方法;药物的化学子结构对应着881位指纹,Structure(d)代表药物化学子结构指纹谱的有效位;A2:计算生物特性相似性生物特性相似性为基于药物靶标蛋白信息的相似性,靶标蛋白从DrugBank数据库中获得,然后使用式(2)的计算公式计算任意两个药物之间的生物特性相似性,得到生物特性相似性矩阵SB;SB=1|T(di)||T(dj)|Σx=1|T(di)|Σy=1|T(dj)|g(Tx(di),Ty(dj))---(2)]]>式(2)为药物di和dj之间的生物特性相似性的计算方法;T(d)表示药物d的靶标蛋白集合,而|T(d)|表示集合的大小;两个蛋白质之间的序列相似性g(Tx,Ty)通过Smith‑Waterman序列相似性算法来计算;A3:计算表型特性相似性表型特性相似性为基于药物适应症信息的相似性,药物适应症从SIDER数据库中获得,两个药物之间的表型特性相似性是通过计算两个适应症在统一医学语言系统中的相似性来获得的,计算两个生物概念条目的路径和语义相似性,得到对应的表型特性相似性矩阵SP;A4:计算药理学特性相似性药理学特性相似性为基于药物ATC编码的相似性,ATC编码从KEGG数据库中获得,部分无法直接获得的,通过在线工具SPACE获取这部分药物的候选ATC编码,然后使用式(3)来计算任意两个药物之间的药理学特性相似性,得到药理学特性相似性矩阵ST;ST(ti,tj)=ω(ti)ω(tj)exp(‑γd(ti,tj)) (3)式(3)为两个ATC编码ti和tj基于一个概率模型来计算药物药理学特性相似性的计算方法;d(ti,tj)表示两个ATC编码在ATC分类系统的五层层级系统中的最短距离;ω(t)表示相应ATC的权重,是ATC编码在数据集中出现频率的倒数;γ是预定义参数,设置为0.25;对于有多个ATC编码的药物,针对每一个ATC编码都计算一个药理学相似性,然后取平均值;步骤2:构建药物副作用的预测模型B1:建模并预测利用K近邻方法分别对化学特性相似性矩阵sc、生物特性相似性矩阵SB和表型特性相似性矩阵SP构建独立的模型,并分别利用这三个独立的模型进行药物副作用预测,得到这三个模型对应的AUC分值,AUPR分值和运行时间;B2:集成并预测利用集成算法将B1步得到的三个独立的模型进行集成,并利用集成后的模型进行药物副作用预测,得到此模型对应的AUC分值,AUPR分值和运行时间;B3:建模后集成并预测利用K近邻方法对药理学特性相似性矩阵ST建立独立模型,并将B1步得到的三个独立模型与此独立模型集成,利用集成后的模型进行药物副作用预测,得到此模型对应的AUC分值,AUPR分值和运行时间,以及最终预测结果—药物副作用相互作用关系矩阵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710323917.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用