[发明专利]一种基于预训练卷积神经网络的关系抽取方法及系统有效
申请号: | 202011014318.7 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112084790B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 曹卫东;徐秀丽 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 天津市鼎和专利商标代理有限公司 12101 | 代理人: | 蒙建军 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 训练 卷积 神经网络 关系 抽取 方法 系统 | ||
1.一种基于预训练卷积神经网络的关系抽取方法,其特征在于,一方面利用预训练模型提取目标实体的语义信息,另一方面使用卷积神经网络提取句子级的语义信息;具体为:先对数据集进行处理,在文本句子的开头、结尾以及实体前后加入特殊标签,识别出一个句子和两个目标实体,然后将处理好的数据输入预训练模型、卷积神经网络模型,提取目标实体和句子的语义,将获取的句子语义、实体语义、标签语义连接,通过softmax分类器获取目标实体之间的关系;
所述关系抽取方法包括如下步骤:
步骤一:数据预处理,对于标签序列s={x1,x2,……xn},xi为句子的第i个词向量,n为模型设置的输入句子的最大长度,开头和结尾分别添加[CLS],[SEP]标签和一些特殊的规范字符;输入处理模块将每个xi编码成一个包含两个目标实体和特殊标签符号的向量ei的公式为:
ei=Etoken(xi)+Eseg(xi)+Epos(xi)
其中,Etoken(xi)表示词嵌入,Eseg(xi)表示片段嵌入,Epos(xi)表示位置嵌入;
步骤二:将处理好的数据输出到预训练模型中进行预训练;
经过预训练BERT后最终输出的隐藏向量是H={H0,H1,H2,…,Hn },标签向量为H0,向量Hi到Hj是实体e1的BERT的最终隐藏状态向量,而Hk到Hm是实体e2的BERT的最终隐藏状态向量;
步骤三:BERT预训练完成后,对实体向量取平均并激活,再分别使用卷积神经网络和全连接神经网络提取句子和两个目标实体中的语义信息;
标签语义获取:
H′0=W0(tanh(H0))+b0
其中:W0是参数矩阵,且W0∈Rd×d,d是BERT的隐藏状态大小,b0是偏差向量;
实体语义获取:
其中,W1,W2是参数矩阵,具有相同的维度,即W1∈Rd×d,W2∈Rd×d,d是BERT的隐藏状态大小,b1,b2是偏差向量,且W1=W2,b1=b2;
句子语义提取:
对BERT层的输出矩阵H={H0,H1,H2,…,Hn }进行卷积、降采样操作,然后通过拼接层,提取文本特征;当卷积核长度为k,卷积核滑动的步长设为1时,对文本矩阵进行上下滑动,则H分成{H0:k,H1:k+1,H2:k+2,…,Hn-k+1:n},其中Hi:j表示向量Hi到Hj的所有向量的级联,对于每一个分量执行卷积操作后得到向量C={C0,C1,C2,…,Cn-k+1},Ci是对分量Hi:i+k-1执行卷积操作后得到的值,称为一个局部特征映射,计算公式为:
Ci=W3THi:i+k-1+b3
其中,W3是卷积核的参数,按照均匀分布随机初始化,并在模型训练过程中不断学习;b3是偏差向量;
对卷积捕获的文本特征映射向量C进行最大池化操作:
对于q个卷积核:
经过全连接后卷积神经网络的输出向量为最终的向量C’;
步骤四:将提取的标签语义,句子语义和实体语义信息进行全连接;
h”=W4[concat(C′,H′0,H′1,H′2)]+b4
其中,W4∈RL×4d,L是关系类型的个数,b4是偏差向量;
步骤五:通过softmax分类器对实体关系进行抽取,输出两个目标实体的关系;
p=softmax(h”)
p是概率输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011014318.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车轴承用密封圈材料制备方法
- 下一篇:一种脱敏糊剂及其制备方法和用途