[发明专利]基于改进深度残差网络和注意力机制的实体关系抽取方法有效
申请号: | 201910880164.0 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110619121B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 陈璟;袁祯祺;宋威 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/211;G06F16/33;G06F16/35;G06N3/0464;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 向文 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 深度 网络 注意力 机制 实体 关系 抽取 方法 | ||
1.基于改进深度残差网络和注意力机制的实体关系抽取方法,其特征在于:包括如下步骤:
步骤S1:数据集处理:
通过对远程监督实体关系数据集的处理,将英文转换为词向量;
步骤S2:自注意力机制:
通过每个包中句子实体对的自注意力机制的输出来获取每句句子中隐藏的关系词,并计算余弦相似度从而提取句子的关系词权重;
步骤S3:分段门控残差网络:
在原有深度残差网络的基础上改进去残差单元,分别引入分段和门控机制,形成分段的具有门模块的残差网络,采用分段门控残差网络对特征通道进行分段;
步骤S4:双池化层:
在残差网络的后段最大池化层的基础上拼接平均池化层形成双池化层,用于保留句子结构特征;
步骤S5:将步骤S2得到的关系词权重与步骤S4得到的句子结构特征进行相乘,得到模型最终的句子特征;
步骤S6:模型预测与输出:
将步骤S5得到的句子特征通过点积融合成传入Softmax层进行关系分类,最终得到结果输出实体关系;
所述步骤S3具体为:
S3-1:分段门控残差模块通过实体对特征通道进行分段,第z个通道的公式为:
其中,uc为来自上层网络通过卷积后的特征通道,在空间维度H上,通过压缩u来产生输出属于uc的统计量zc;
S3-2:将通道通过每句句子中实体的位置进行分段,形成3段特征通道:
zc-→(e1,e2)-→(z1,z2,z3)
其中,e1,e2为两个实体;
S3-3:当特征通道压缩之后,分段门控残差模块采用门控机制,使用Sigmoid激活函数对zc产生权重,其中W1,W2为两个权重矩阵,如下式所示:
s=σ(W2δ(W1z))
S3-4:分段门控残差模块的最终输出是将权重sc与上层卷积后的特征通道(z1,z2,z3)相乘后得到的,具体如下式所示:
xc=Fs((z1,z2,z3),(s1,s2,s3))=sc·zc。
2.根据权利要求1所述的基于改进深度残差网络和注意力机制的实体关系抽取方法,其特征在于:所述步骤S1中每个词的向量表示由两部分组成:词向量Vw和位置向量Vp,定义为V,词向量的具体表示方法如下:
V=Vw+Vp
Si={V1,V2,…,Vn}
其中Vw为带有语义关联的词向量,Vp为带有位置信息的词向量,V为拼接后的词向量,Si是句子组成的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910880164.0/1.html,转载请声明来源钻瓜专利网。