[发明专利]一种基于集成学习的关系抽取方法及系统有效
申请号: | 201911171322.1 | 申请日: | 2019-11-26 |
公开(公告)号: | CN111125434B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 孙新;姜景虎;蔡琪;侯超旭;盖晨;尚煜茗 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F40/289;G06F40/30;G06F18/214;G06N3/0464;G06N20/20 |
代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 许天易 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 关系 抽取 方法 系统 | ||
1.一种基于集成学习的关系抽取方法,其特征在于,所述方法包括:
S1、接收文本数据和实体对,分句,确定语句的目标实体对,构建由包含所述实体对的语句组成的句包;
S2、对语句中单词构建词向量,为语句构建词向量序列;
S3、通过多角度卷积神经网络,从词向量序列中提取语句特征,构建句向量;
S4、通过动态路由机制,使用句向量“投票”方法构建句包向量;
S5、通过由全连接层和softmax层构成的分类器,确定句包对应的关系;
所述多角度卷积神经网络包括卷积层、池化层和全连接层;
所述步骤S4中,通过动态路由机制计算得到句包向量,该机制的迭代计算公式为:
其中,j为迭代次数,qi为句包中第i个句向量,为耦合系数,表示qi所占权重,加和为1,bj为句包向量,d为存耦合系数的临时变量,squash是激活函数。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,确定语句的目标实体对的步骤包括:
S11、把语句中所述实体对的两类实体和位置信息分别放入集合E1,E2中;
S12、将距离最近的所述实体对放入集合C中;
S13、如果集合C中只有一个实体对,那么该实体对为目标实体对;否则,将距离句子中间位置最近的实体对放入集合D中;
S14、如果集合D中只有一个实体对,那么该实体对为目标实体对;否则集合中第一个实体对为目标实体对。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中构建词向量的步骤包括:
S21、将语句s={w1,w2,...,wn}中的单词与目标实体对的相对距离映射为de维位置向量其中,wi为语句中第i个单词,n为语句中单词数量,e1,e2分别表示目标实体对的两个目标实体;
S22、使用Skip-gram模型,对每个单词wi构建其词向量vi;
S23、构建包含位置信息的词向量xi及语句的词向量序列X:
X=x1,x2,...,xn。
4.根据权利要求1所述的方法,其特征在于,所述步骤S3中,卷积层包含两个一维卷积核,大小分别为3和7,池化层采取top-4池化方法,经过全连接层获取句向量q。
5.根据权利要求1所述的方法,其特征在于,所述步骤S5中,将由句包向量构成的矩阵B作为分类器中全连接层的输入,其输出为:
o=WrB+D
其中,Wr为参数矩阵,D为偏置向量,B为包级别的表示矩阵,B由多个句包向量构成。
6.根据权利要求5所述的方法,其特征在于,所述步骤S5中,分类器中softmax层将全连接层的输出归一化,计算句包分到每一类关系的关系概率p(r|B,θ):
其中,θ为多角度卷积神经网络和分类器的参数,n为句包数目,r为关系。
7.根据权利要求6所述的方法,其特征在于,所述步骤S5中,以交叉熵J(θ)为目标函数训练所述多角度卷积神经网络和所述分类器;
其中,n为句包数目,r为关系,Bi为第i个句包向量,为第i个句包的关系,表示当参数为θ时,第i个句包向量分到关系的关系概率;
训练完成后,对于输入到分类器的句包,关系概率最大的关系为句包所属关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911171322.1/1.html,转载请声明来源钻瓜专利网。