[发明专利]一种基于多层卷积神经网络的药物关系分类方法有效
申请号: | 201810133344.8 | 申请日: | 2018-02-09 |
公开(公告)号: | CN108363774B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 冯筠;杜晓东;孙霞;陈静;马龙 | 申请(专利权)人: | 西北大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 张明 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 卷积 神经网络 药物 关系 分类 方法 | ||
本发明公开了一种基于多层卷积神经网络的药物关系分类方法,通过采集英文形式的原始药物文本,获得原始药物文本集,对所述的原始药物文本集进行预处理,构造多层卷积神经网络并进行训练,获得药物关系分类多层卷积神经网络,利用所述的药物关系分类多层卷积神经网络进行药物关系分类,获得药物关系分类结果,本发明提供的方法通过对多层卷积神经网络的改进,增加了表示层,将输入的药物文本转换为药物文本向量,并且加入了基于相对距离的位置向量,使得药物文本特征向量提取更加精确,提高了基于多层神经网络的药物关系分类方法的准确率。
技术领域
本发明涉及药物关系分类方法,具体涉及一种基于多层卷积神经网络的药物关系分类方法。
背景技术
近年来,随着生命科学的快速发展,形成了海量的生物医学文献。据资料统计,仅生物医学文献数据库Medline收录了超过2300万的生物医学文献数目,其中蕴藏了大量未被结构化表示的生物医学知识。对这些知识进行结构化的表示,有助于生物医学关系数据库的建立,进而提高生物医学文献检索的效率及准确度,帮助研究者快速定位目标信息及相关文献。
生物实体关系抽取是指从生物医学文献中抽取实体间的关系。实体包括蛋白质、疾病、药物、基因及生物事件,其中,药物关系分类是研究从医学文献中自动抽取出两种药物之间存在的相互作用。在药物开发过程中药物表现出的药性可能只在小范围个体上成立,药物副作用往往在上市以后才会被发现。当某位病人同时服用两款以上的药物时,更容易产生药物副作用。药物关系分类的研究对减少药物安全事故,降低医疗成本,具有十分重要的意义。
现有技术在对药物关系进行分类时,存在需要人工干预和相关领域知识,文本特征提取过程复杂,耗费大量资源和时间等问题。
发明内容
本发明的目的在于提供一种基于多层卷积神经网络的药物关系分类方法,用以解决现有技术中对药物关系分类时文本特征提取不准确,导致分类效果不佳的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于多层卷积神经网络的药物关系分类方法,包括以下步骤:
步骤1,采集由英文的单词构成的原始药物文本,获得原始药物文本集,所述的原始药物文本中至少包括两个目标药物名称词,在所述的原始药物文本中除去所述目标药物名称词均为其他单词;
步骤2,对所述的原始药物文本集进行预处理,包括词形归一化以及目标药物名称词命名方式的统一及替换,获得预处理后的药物文本集;
步骤3,构造包含表示层、卷积层、池化层和全连接层的多层卷积神经网络;采用输入与输出对所述的多层卷积神经网络进行训练,获得药物关系分类多层卷积神经网络;其中所述的输入为所述的预处理后的药物文本集,所述的输出为药物关系标签集,所述的药物关系标签集中的每一个药物关系标签为所述预处理后的药物文本集中的每一个药物文本对应的原始药物文本中任意两个目标药物名称词之间存在的药物关系;其中所述的表示层将所述的预处理后的药物文本集中的每一个药物文本映射成文本特征向量,所述的药物文本特征向量包括药物文本向量和所述其他单词与所述目标药物名称词之间的位置向量;
步骤4,利用所述的药物关系分类多层卷积神经网络对未知药物关系的药物文本进行药物关系分类,获得药物关系分类结果。
进一步地,所述的步骤2,对所述的原始药物文本集进行预处理,包括词形归一化以及目标药物名称词命名方式的统一及替换,获得预处理后的药物文本集,包括以下步骤:
步骤21、将所述原始药物文本集中所有所述的单词进行词形归一化,获得归一化后的药物文本集;
步骤22、对所述的归一化后的药物文本集中所有所述的目标药物名称词首先以统一形式命名,再利用统一形式命名后的目标药物名称词将所述的目标药物名称词进行替换,获得所述预处理后的药物文本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810133344.8/2.html,转载请声明来源钻瓜专利网。