[发明专利]一种基于生物医学知识图谱推理的药物识别方法有效
申请号: | 201811127803.8 | 申请日: | 2018-09-27 |
公开(公告)号: | CN109325131B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 杨志豪;桑盛田 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/08;G16H20/10 |
代理公司: | 大连星海专利事务所有限公司 21208 | 代理人: | 徐雪莲 |
地址: | 116023 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生物 医学知识 图谱 推理 药物 识别 方法 | ||
一种基于生物医学知识图谱推理的药物识别方法,该方法包括以下步骤:S1、下载生物医学文本数据;S2、构造生物医学知识图谱;S3、构造药物‑靶标‑疾病关系数据集;S4、使用图嵌入的方法对图进行表示学习;S5、训练基于长短记忆神经网络的药物发现模型步骤;S6、使用训练好的模型进行药物识别步骤。本发明适用于寻找疾病潜在的治疗药物,不限于疾病和药物的种类;能够有效的从文献中发现治疗疾病的药物,对药物发现领域具有重要的意义。
技术领域
本发明涉及数据挖掘方法领域,尤其是一种基于生物医学知识图谱推理的药物识别方法。
背景技术
药物发现(drug discovery)是医药产业发展的核心驱动力,也是社会发展的重要需求。目前主要存在两类药物发现的方法,分别是高通量筛选(High-throughputscreening,HTS)和计算机辅助药物发现方法(computer-aided drug discovery/design,CADD)。然而,尽管药物研发模式和技术有了巨大革新,药物发现依旧是一个十分漫长且耗资巨大的过程,开发一款新药平均需要14年时间,耗资约18亿美元。因此,如何提高药物发现的效率具有重大的理论价值和实用价值。
从已发表的生物医学文献中发现新的药物是一种经济安全的药物发现方法。已发表的生物医学文献中隐含着无法治愈疾病的潜在治疗方法,比如雷诺士病(RaynaudDisease)在1986年以前是一种无法治愈的疾病,Don R.Swanson通过阅读一部分医学文献发现雷诺士病的患者都伴随血粘稠度升高、血脂升高等医学特征;Swanson又通过阅读另一部分医学文献发现食用鱼油(Fish Oil)可以降低血脂、降低血粘稠度等现象。因此Swanson作出了食用鱼油可以治疗雷诺士病的假设,这个结论在两年后被临床试验所验证。因此,使用文本挖掘(literature mining)进行药物发现是一个可行的方法。现有的文本挖掘相关的药物发现方法主要分以下几种:
一、基于共现的方法:该方法主要通过与药物和疾病都相关的中间物质来推断药物和疾病可能存在的关系。
二、基于语义的方法:该方法首先通过关系抽取等技术有选择性的从文献中抽取出药物-实体、疾病-实体关系,再利用已抽取的关系作出药物-疾病关系预测。
三、基于图结构的方法:该方法首先通过抽取得到的实体关系构造一个网络,然后在该网络上使用聚类、分类等机器学习算法进行药物-疾病关系预测。
然而,近年来随着生物医学领域的快速发展,生物医学文献数量呈指数性增加,海量的文献和信息为现有的文本挖掘方法带来了难题。
发明内容
本发明的目的是提供一种能够充分利用现有的海量医学文献进行药物识别,并可辅助药物研发工作的基于生物医学知识图谱推理的药物识别方法。
本发明解决现有技术问题所采用的技术方案:一种基于生物医学知识图谱推理的药物识别方法,包括以下步骤:
S1、下载生物医学文本数据:在医学文献检索系统中下载生物医学文献,并将下载得到的生物医学文献全文以字符串的形式存储在本地,得到生物医学文献库;
S2、构造生物医学知识图谱:包括以下步骤:
a1、抽取实体间关系:利用关系抽取工具SemRep从所述生物医学文献库中抽取得到生物实体间关系,并将抽取得到的生物实体间关系以字符串的形式存储在本地;
a2、基于频率的候选实体关系过滤:预设最小频率阈值,并将在步骤a1中得到的生物实体间关系中出现次数小于预设最小频率阈值的生物实体间关系过滤掉,得到用于构造生物医学知识图谱的实体间关系数据集S;
a3、构造生物医学知识图谱:利用步骤a2得到的实体间关系数据集S构造知识图谱;在知识图谱中以实体间关系数据集S中的各个生物实体作为节点,知识图谱中的边为实体间关系数据集S中生物实体间关系,从而得到生物医学知识图谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811127803.8/2.html,转载请声明来源钻瓜专利网。