[发明专利]一种关系抽取系统、方法和装置在审

专利信息
申请号: 201910556214.X 申请日: 2019-06-25
公开(公告)号: CN112131879A 公开(公告)日: 2020-12-25
发明(设计)人: 张鹏 申请(专利权)人: 普天信息技术有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 张驰;宋志强
地址: 100080 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 关系 抽取 系统 方法 装置
【权利要求书】:

1.一种关系抽取系统,其特征在于,包括:

来自变换器的双向编码器表征量BERT层,用于对输入句子的向量矩阵进行分类,所述分类的类别包括实体无关系的噪音句子和实体有关系的句子;

卷积神经网络CNN层,用于将被分类为实体有关系的句子的向量矩阵转换为句向量;

注意力层,用于计算所述句向量与关系向量之间的相似度,基于所述相似度为所述句向量设置权重,并基于所述句向量的加权求和结果得到所述关系向量的输出矩阵;

线性层,用于对所述输出矩阵降维,以得到输出向量;

Softmax层,用于对所述输出向量执行概率规划计算,以获取所述输入句子的关系概率分布。

2.根据权利要求1所述的关系抽取系统,其特征在于,还包括:

词向量计算工具,用于将所述输入句子分为100个词,其中输入句子中多于100个词的多余部分被截掉,不足100个词的输入句子的不足部分用零补全;将所述100个词分别转换为维度为50的词向量;基于每个词的词向量生成所述输入句子的向量矩阵。

3.根据权利要求2所述的关系抽取系统,其特征在于,

所述CNN层,用于将被分类为实体有关系的句子的向量矩阵转换为维度为230的句向量;所述关系向量的数目为N;所述输出矩阵为N×230矩阵;

所述线性层,用于将所述N×230矩阵转换为N维的输出向量。

4.根据权利要求1所述的关系抽取系统,其特征在于,

所述BERT层,用于将类别为噪音句子的向量矩阵附加标签值0,将类别为实体有关系的句子的向量矩阵附加标签值1;

所述卷积神经网络CNN层,用于将标签值1的向量矩阵转换为句向量。

5.根据权利要求1所述的关系抽取系统,其特征在于,

所述关系抽取系统的损失函数为L,L=L1+L2

其中L1为句子分类损失函数,L2为关系分类损失函数。

6.一种关系抽取方法,其特征在于,包括:

使能来自变换器的双向编码器表征量BERT层对输入句子的向量矩阵进行分类,所述分类的类别包括实体无关系的噪音句子和实体有关系的句子;

使能卷积神经网络CNN层将被分类为实体有关系的句子的向量矩阵转换为句向量;

使能注意力层计算所述句向量与关系向量之间的相似度,基于所述相似度为所述句向量设置权重,并基于所述句向量的加权求和结果得到所述关系向量的输出矩阵;

使能线性层对所述输出矩阵降维,以得到输出向量;

使能Softmax层对所述输出向量执行概率规划计算,以获取所述输入句子的关系概率分布。

7.根据权利要求6所述的关系抽取方法,其特征在于,该方法还包括:

使能词向量计算工具将所述输入句子分为100个词,其中输入句子中多于100个词的多余部分被截掉,不足100个词的输入句子的不足部分用零补全;将所述100个词分别转换为维度为50的词向量;基于每个词的词向量生成所述输入句子的向量矩阵。

8.根据权利要求6所述的关系抽取方法,其特征在于,

使能BERT层对输入句子的向量矩阵进行分类包括:使能所述BERT层将类别为噪音句子的向量矩阵附加标签值0,将类别为实体有关系的句子的向量矩阵附加标签值1;

所述使能CNN层将被分类为实体有关系的句子的向量矩阵转换为句向量包括:使能所述CNN层将标签值1的向量矩阵转换为句向量。

9.一种关系抽取装置,其特征在于,包括处理器和存储器;

所述存储器中存储有可被所述处理器执行的应用程序,用于使得所述处理器执行如权利要求6-8中任一项所述的关系抽取方法。

10.一种计算机可读存储介质,其特征在于,其中存储有计算机可读指令,该计算机可读指令用于执行如权利要求6-8中任一项所述的关系抽取方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910556214.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top