[发明专利]基于隐式句法结构依赖的关系抽取方法以及可读存储介质在审
申请号: | 202210374608.5 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114676680A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 王剑;双锴;马利川;谭逸佳 | 申请(专利权)人: | 北京合立春天科技发展有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人: | 逯雪峰 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 句法 结构 依赖 关系 抽取 方法 以及 可读 存储 介质 | ||
1.基于隐式句法结构依赖的关系抽取方法,其特征在于,包括以下步骤:
步骤1:使用LSTM神经网络对输入的单词进行编码,并利用卷积神经网络对输入文本中相邻的单词之间抽取得到相对句法距离;
步骤2:将相对句法距离与LSTM神经网络中的门控机制相结合,控制信息在不同时间步中的依赖程度,预训练得到一个能隐式解析文本语义的RSD—LSTM语言模型;
步骤3:对于经过RSD—LSTM语言模型向量化处理后的文本,使用Reletion-Aware注意力机制来对输入的文本进行特征抽取,对每一个关系都建立一个特定的向量表征;
步骤4:基于文本特征和标注的标签,进行有监督的训练,得到关系抽取模型,其中Realtion-Aware注意力机制加权输出的特征向量作为全连接层的输入,对全连接层的输出与每一个关系向量之间做内积,采用Softmax分类器进行关系类别的分类。
2.根据权利要求1所述的基于隐式句法结构依赖的关系抽取方法,其特征在于,步骤1在计算相对句法距离时,由卷积神经网络的卷积层和完全连接层进行计算;
其中,卷积层,在文本序列的垂直方向做卷积,卷积核的宽度固定为词向量的维度,高度是2,代表只对两个相邻的单词做卷积得到句法距离;依次对每个可能的窗口做卷积操作得到句法距离的集合;
完全连接层,计算抽取到的句法距离与全局语义向量的相似度,将归一化后的相似度作为两个相邻单词之间的依赖程度。
3.根据权利要求2所述的基于隐式句法结构依赖的关系抽取方法,其特征在于,相对句法距离的计算公式为:
Dt=sigmoid(dt*E)
其中dt表示从xt-1和xt两个输入单词之间抽取得到的句法距离,E代表全局的语义向量,Dt表示从xt-1和xt两个输入单词之间抽取得到的相对句法距离。
4.根据权利要求1所述的基于隐式句法结构依赖的关系抽取方法,其特征在于,步骤2具体包括:把两个相邻单词得到的相对句法距离融入到LSTM网络的遗忘门和输入门当中,根据句法树中两个相邻单词之间的语义依赖程度来控制单词之间信息传递的程度,然后预训练得到一个能隐式解析文本语义的RSD—LSTM语言模型。
5.根据权利要求1所述的基于隐式句法结构依赖的关系抽取方法,其特征在于,步骤3中,所述的Reletion-Aware注意力机制在对输入的文本进行处理时,赋予每个类别标签一个特定的向量,通过标签向量计算句子中每个单词对应的注意力权重,加权生成文本表征,对于每一个标签都采用该注意力机制进行计算,最后得到K个不同的文本表征,对应K个关系类别。
6.根据权利要求5所述的基于隐式句法结构依赖的关系抽取方法,其特征在于,所述注意力权重的计算公式为:
其中dk代表第k个关系标签,ei代表输入文本中的第i个单词。
7.可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至6任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合立春天科技发展有限公司,未经北京合立春天科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210374608.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地铁施工便于拆装的安全隔离栏
- 下一篇:一种高强度防爆胎轮毂及加工平台