[发明专利]一种基于层次推理的医学实体关系抽取方法有效

专利信息
申请号: 202110709798.7 申请日: 2021-06-25
公开(公告)号: CN113553440B 公开(公告)日: 2022-08-16
发明(设计)人: 段鹏飞;熊晨薇;熊盛武;尹娇柔 申请(专利权)人: 武汉理工大学
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35;G06N3/04;G06N3/08;G06N5/04;G06K9/62;G16H50/70;G06F40/211;G06F40/242;G06F40/247
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 罗飞
地址: 430070 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 层次 推理 医学 实体 关系 抽取 方法
【说明书】:

发明提供了一种基于层次推理的医学实体关系抽取方法,是通过基于层次推理的实体关系抽取模型来提取新冠肺炎相关实体关系三元组的方法,首先,利用远程监督将已有知识库与相关文献进行对齐,构建了COVID‑19实体关系抽取数据集;然后,基于门控卷积和膨胀卷积,构建了从不同维度来提取上下文信息的特征提取器;最终,基于层次推理机制,利用不同粒度的文档信息来对文本进行实体关系抽取,提升了文档级实体关系抽取模型的准确率。本发明的有益效果是:抽取新冠肺炎相关数据的实体关系,可以为后续研究任务如知识图谱、问答系统等提供基础,为进一步对新冠肺炎的防治工作提供基础。

技术领域

本发明涉及自然语言处理技术领域,具体涉及文档级关系抽取,尤其涉及一种基于层次推理的医学实体关系抽取方法。

背景技术

文档级关系抽取的方法,基本上可以分为两大类:基于序列的模型和基于图的模型。基于序列的模型利用神经网络来层次化建模实体、句子和文档信息从而推理出文档中的实体关系,而基于图的模型则利用图的思想来对文档中的语义信息进行重新建模,如何更加高效地构建基于文档的图网络以及如何对图网络进行推理是该类方法提升的关键。

然而现有技术的方法,由于没有很好地融合文本中信息从而导致抽取效果不佳。

发明内容

本发明提出一种基于层次推理的医学实体关系抽取方法,用于解决或者至少部分解决现有技术中由于没有很好地融合文本中信息从而导致抽取效果不佳的技术问题。

为了解决上述技术问题,本发明提供了一种基于层次推理的医学实体关系抽取方法,包括:

S1:获取训练语料,训练语料为医学数据集;

S2:构建实体关系抽取模型,实体关系抽取模型包括嵌入模块、特征提取模块、实体层推理模块、句子层推理模块、文档层推理模块以及关系分类模块,其中,嵌入模块用于分别获取输入文本的句子层嵌入表示和实体层嵌入表示,特征提取模块用于采用门控膨胀卷积网络进行特征特征提取,实体层推理模块用于融合实体信息、实体类型信息和共指信息对实体进行表示,将双线性变换和迁移约束应用在多个子空间的目标实体对获得实体层推理信息,句子层推理模块用于引入注意力机制来计算每个句子所提供的信息量权重,将句子的单词表示形式进行融合得到句子向量,然后融合实体层推理信息得到句子层推理信息,文档层推理模块用于在句子层推理信息的基础上构建一个门控膨胀卷积网络,并引入注意力机制得到文档层推理信息,关系分类模块用于将实体层推理信息与文档层推理信息进行融合,得到实体关系的类别;

S3:利用获取的训练语料对实体关系抽取模型进行训练,使用交叉熵作为损失函数,利用Adam优化器来更新模型的参数,得到训练好的实体关系抽取模型;

S4:利用训练好的实体关系抽取模型对输入文本的实体关系进行抽取。

在一种实施方式中,步骤S1包括:

S1.1:构建以新冠肺炎疾病为中心的实体关系类型体系;

S1.2:爬取新冠肺炎相关文献语料;

S1.3:利用医学知识库中的三元组与新冠肺炎语料进行实体对齐;

S1.4:利用基于双数组字典树的方法对实体对齐后的语料进行自动标注,得到新冠肺炎实体关系抽取语料库,将其作为训练语料。

在一种实施方式中,步骤S2中嵌入模块,采用预训练模型BioBERT得到具有上下文信息的词向量表示,词向量表示与位置特征表示作为句子层嵌入表示,利用Glove得到包含实体信息和实体类型信息的实体类型向量和包含共指信息的共指向量,作为实体层嵌入表示。

在一种实施方式中,步骤S2中句子层推理模块的处理过程包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110709798.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top