[发明专利]一种基于集成学习的关系抽取方法及系统有效

专利信息
申请号: 201911171322.1 申请日: 2019-11-26
公开(公告)号: CN111125434B 公开(公告)日: 2023-06-27
发明(设计)人: 孙新;姜景虎;蔡琪;侯超旭;盖晨;尚煜茗 申请(专利权)人: 北京理工大学
主分类号: G06F16/75 分类号: G06F16/75;G06F40/289;G06F40/30;G06F18/214;G06N3/0464;G06N20/20
代理公司: 北京京万通知识产权代理有限公司 11440 代理人: 许天易
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 集成 学习 关系 抽取 方法 系统
【权利要求书】:

1.一种基于集成学习的关系抽取方法,其特征在于,所述方法包括:

S1、接收文本数据和实体对,分句,确定语句的目标实体对,构建由包含所述实体对的语句组成的句包;

S2、对语句中单词构建词向量,为语句构建词向量序列;

S3、通过多角度卷积神经网络,从词向量序列中提取语句特征,构建句向量;

S4、通过动态路由机制,使用句向量“投票”方法构建句包向量;

S5、通过由全连接层和softmax层构成的分类器,确定句包对应的关系;

所述多角度卷积神经网络包括卷积层、池化层和全连接层;

所述步骤S4中,通过动态路由机制计算得到句包向量,该机制的迭代计算公式为:

其中,j为迭代次数,qi为句包中第i个句向量,为耦合系数,表示qi所占权重,加和为1,bj为句包向量,d为存耦合系数的临时变量,squash是激活函数。

2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,确定语句的目标实体对的步骤包括:

S11、把语句中所述实体对的两类实体和位置信息分别放入集合E1,E2中;

S12、将距离最近的所述实体对放入集合C中;

S13、如果集合C中只有一个实体对,那么该实体对为目标实体对;否则,将距离句子中间位置最近的实体对放入集合D中;

S14、如果集合D中只有一个实体对,那么该实体对为目标实体对;否则集合中第一个实体对为目标实体对。

3.根据权利要求1所述的方法,其特征在于,所述步骤S2中构建词向量的步骤包括:

S21、将语句s={w1,w2,...,wn}中的单词与目标实体对的相对距离映射为de维位置向量其中,wi为语句中第i个单词,n为语句中单词数量,e1,e2分别表示目标实体对的两个目标实体;

S22、使用Skip-gram模型,对每个单词wi构建其词向量vi

S23、构建包含位置信息的词向量xi及语句的词向量序列X:

X=x1,x2,...,xn。

4.根据权利要求1所述的方法,其特征在于,所述步骤S3中,卷积层包含两个一维卷积核,大小分别为3和7,池化层采取top-4池化方法,经过全连接层获取句向量q。

5.根据权利要求1所述的方法,其特征在于,所述步骤S5中,将由句包向量构成的矩阵B作为分类器中全连接层的输入,其输出为:

o=WrB+D

其中,Wr为参数矩阵,D为偏置向量,B为包级别的表示矩阵,B由多个句包向量构成。

6.根据权利要求5所述的方法,其特征在于,所述步骤S5中,分类器中softmax层将全连接层的输出归一化,计算句包分到每一类关系的关系概率p(r|B,θ):

其中,θ为多角度卷积神经网络和分类器的参数,n为句包数目,r为关系。

7.根据权利要求6所述的方法,其特征在于,所述步骤S5中,以交叉熵J(θ)为目标函数训练所述多角度卷积神经网络和所述分类器;

其中,n为句包数目,r为关系,Bi为第i个句包向量,为第i个句包的关系,表示当参数为θ时,第i个句包向量分到关系的关系概率;

训练完成后,对于输入到分类器的句包,关系概率最大的关系为句包所属关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911171322.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top