[发明专利]基于量子注意力机制双向长短期记忆预测模型及提取方法在审
申请号: | 202110196930.9 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112863695A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 张善文;黄文准;王振 | 申请(专利权)人: | 西京学院 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G06F16/33;G06F16/35;G06F40/211;G06F40/30;G06N3/04;G06N3/08;G06N10/00 |
代理公司: | 西安众和至成知识产权代理事务所(普通合伙) 61249 | 代理人: | 艾慧康 |
地址: | 710123 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量子 注意力 机制 双向 短期 记忆 预测 模型 提取 方法 | ||
本发明公开了基于量子注意力机制双向长短期记忆预测模型及提取方法,模型包括向量嵌入模块、量子双向长短期记忆模块、量子注意力机制模块和分类模块,量子双向长短期记忆模型由向量嵌入模块得到向量的深层表达特征,然后通过量子注意力机制模块提取重要的分类特征,最后利用分类器进行药物不良反应分类预测,量子双向长短期记忆模块包括前向QLSTM网络和后向QLSTM网络,比现有的注意力机制长短时记忆模型更稳定、训练速度和收敛更快,能够快速学习到更多药物不良反应信息,具有快速学习和高速处理药物不良反应信息预测的能力,提取方法能够帮助医生和患者合理用药,避免药物不良反应,辅助新药开发和药品安全监测。
技术领域
本发明属于模式识别与生物信息技术领域,具体涉及基于量子注意力机制双向长短期记忆预测模型及提取方法。
背景技术
众所周知,药物不良反应(Adverse drug reaction,ADR)可能引起患者呕吐、头晕、耳鸣、过敏等现象,严重的ADR会导致患者病情恶化、休克、甚至死亡发生,而且发生ADR的原因复杂多种多样。实际上,在任何疾病治疗中都可能发生各种意想不到的ADR,而且用药种类越多,发生ADR的概率越大。据WHO统计,各国住院人数的10%~20%因ADR导致、5%因ADR死亡;ADR发生率在联合用药5种以下为4%,6~10种为10%(不包括降低药物疗效情况)。据统计,我国每年因ADR导致约250万人住院、3万儿童耳聋、20余万人死亡,而且我国ADR发生率及其严重程度呈逐年递增态势;美国每年因ADR导致约200万人住院、14万人死亡,其它国家也同样遭受ADR危害。ADR事件的不断发生已引起社会、各国政府和生物医学届的高度重视,ADR提取已成为很多领域的一个研究热点。很多传统的ADR提取方法依赖于规则或词典,但大量ADR相关数据是多种多样的非结构化的文本形式,所以传统方法不能全面、准确地反映数据中包含的真实语义,基于深度学习的ADR提取方法的分类准确度高,但计算效率较低、训练时间较长。因此需要预测更多潜在的ADR信息,帮助医务人员和病人快速准确地了解所使用的药物的ADR信息。
发明内容
为了解决现有技术中的问题,本发明提供了基于量子注意力机制双向长短期记忆预测模型及提取方法,能够更加高效地预测ADR信息,使医务人员和病人快速准确地了解所使用的药物之间的ADR信息。
为了实现以上目的,本发明提供了基于量子注意力机制双向长短期记忆预测模型,包括向量嵌入模块、量子双向长短期记忆模块、量子注意力机制模块和分类模块,所述向量嵌入模块用于从语料数据库中得到语料,并提取词向量、实体类型向量、词性向量和最短依存路径向量,再将词向量、实体类型向量、词性向量和最短依存路径向量拼接为一个嵌入向量;所述量子双向长短期记忆模块包括前向QLSTM网络和后向QLSTM网络,每个所述向量嵌入模块拼接的嵌入向量经所述前向QLSTM网络和所述后向QLSTM网络编码后得到两个隐状态向量,再将两个隐状态向量拼接作为语义表示向量;所述量子注意力机制模块用于引入量子计算将所述量子双向长短期记忆模块提取的特征整合为一个特征向量;所述分类模块用于将所述量子注意力机制模块得到的特征向量输入到分类器进行分类预测。
进一步地,所述向量嵌入模块包括以下步骤:
S1:使用词向量计算工具word2vec将句子中每个词表示为词向量,然后拼接,得到句子向量表示,其中,词向量通过查找词向量表获得;
S2:实体类型向量被映射到与句子长度一致的实值矩阵中,通过统计实体类型的个数,随机初始化实体类型向量表,再从实体类型向量表中查找句子中每个词的实体类型向量;
S3:词性向量被映射到与句子长度一致的实值矩阵中,使用自然语言处理工具包Stanford CoreNLP识别句中每个词的词性,再统计词性类型数,将词的词性标签标记为词性类型,构建词性类型向量表,查找词性类型向量表获取句子中每个词的词性向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西京学院,未经西京学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110196930.9/2.html,转载请声明来源钻瓜专利网。