[发明专利]基于隐式句法结构依赖的关系抽取方法以及可读存储介质在审

专利信息
申请号: 202210374608.5 申请日: 2022-04-11
公开(公告)号: CN114676680A 公开(公告)日: 2022-06-28
发明(设计)人: 王剑;双锴;马利川;谭逸佳 申请(专利权)人: 北京合立春天科技发展有限公司
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 洛阳公信知识产权事务所(普通合伙) 41120 代理人: 逯雪峰
地址: 100000 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 句法 结构 依赖 关系 抽取 方法 以及 可读 存储 介质
【说明书】:

发明提供一种基于隐式句法结构依赖的关系抽取方法以及可读存储介质,本发明的关系抽取方法在不加入任何人为先验信息的前提下,通过神经网络自适应地学习输入文本中单词之间地依赖,隐式引入句法树地结构,提高模型对语义的理解能力;而且,本发明使用了Relation‑Aware的细粒度注意力机制,对于关系抽取中的每个关系都分配一个向量,与文本中的单词通过注意力机制生成最后的表征,避免了已有注意力机制对多个关系标签向量的混淆。

技术领域

本发明涉及自然语言处理领域,具体涉及一种基于隐式句法结构依赖的关系抽取方法以及可读存储介质。

背景技术

自然语言中,句子成分之间的关系通常是树状的:单词、短语和从句按层次构成一个句子,不同成分之间的依赖性决定了句子的句法结构。这种复杂的树状结构对理解自然语言至关重要。然而,循环神经网络(RNN)对语言进行了顺序建模,未能对层次结构的句法依赖进行全面编码,导致网络在基于理解的任务上表现不佳。

此外,随着网络信息的飞速增长,关系抽取任务已经逐渐成为自然语言处理领域的关键任务之一,关系抽取任务的核心就是根据给定的文本和文本中的两个实体,得到实体之间的关系,现有关系抽取任务使用的注意力机制使用一个向量来表示所有的关系,这种方式会混淆不同关系的表征,导致准确率较低。

发明内容

有鉴于此,本发明的目的是提供一种基于隐式句法结构依赖的关系抽取方法以及可读存储介质,以解决背景技术中提到的技术问题。

为了达到上述目的,本发明所采用的技术方案是:基于隐式句法结构依赖的关系抽取方法,其特征在于,包括以下步骤:

步骤1:使用LSTM神经网络对输入的单词进行编码,并利用卷积神经网络对输入文本中相邻的单词之间抽取得到相对句法距离;

步骤2:将相对句法距离与LSTM神经网络中的门控机制相结合,控制信息在不同时间步中的依赖程度,预训练得到一个能隐式解析文本语义的RSD—LSTM语言模型;

步骤3:对于经过RSD—LSTM语言模型向量化处理后的文本,使用Reletion-Aware注意力机制来对输入的文本进行特征抽取,对每一个关系都建立一个特定的向量表征,从而改进已有注意力机制只设置一个关系向量的缺陷;

步骤4:基于文本特征和标注的标签,进行有监督的训练,得到关系抽取模型,其中Realtion-Aware注意力机制加权输出的特征向量作为全连接层的输入,对全连接层的输出与每一个关系向量之间做内积,采用Softmax分类器进行关系类别的分类。

进一步的,步骤1在计算相对句法距离时,由卷积神经网络的卷积层和完全连接层进行计算;

其中,卷积层,在文本序列的垂直方向做卷积,卷积核的宽度固定为词向量的维度,高度是2,代表只对两个相邻的单词做卷积得到句法距离;依次对每个可能的窗口做卷积操作得到句法距离的集合;

完全连接层,计算抽取到的句法距离与全局语义向量的相似度,将归一化后的相似度作为两个相邻单词之间的依赖程度。

进一步的,相对句法距离的计算公式为:

Dt=sigmoid(dt*E)

其中dt表示从xt-1和xt两个输入单词之间抽取得到的句法距离,E代表全局的语义向量,Dt表示从xt-1和xt两个输入单词之间抽取得到的相对句法距离。

进一步的,步骤2具体包括:把两个相邻单词得到的相对句法距离融入到LSTM网络的遗忘门和输入门当中,根据句法树中两个相邻单词之间的语义依赖程度来控制单词之间信息传递的程度,然后预训练得到一个能隐式解析文本语义的RSD—LSTM语言模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合立春天科技发展有限公司,未经北京合立春天科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210374608.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top