[发明专利]一种关系抽取系统、方法和装置在审
申请号: | 201910556214.X | 申请日: | 2019-06-25 |
公开(公告)号: | CN112131879A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 普天信息技术有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张驰;宋志强 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关系 抽取 系统 方法 装置 | ||
1.一种关系抽取系统,其特征在于,包括:
来自变换器的双向编码器表征量BERT层,用于对输入句子的向量矩阵进行分类,所述分类的类别包括实体无关系的噪音句子和实体有关系的句子;
卷积神经网络CNN层,用于将被分类为实体有关系的句子的向量矩阵转换为句向量;
注意力层,用于计算所述句向量与关系向量之间的相似度,基于所述相似度为所述句向量设置权重,并基于所述句向量的加权求和结果得到所述关系向量的输出矩阵;
线性层,用于对所述输出矩阵降维,以得到输出向量;
Softmax层,用于对所述输出向量执行概率规划计算,以获取所述输入句子的关系概率分布。
2.根据权利要求1所述的关系抽取系统,其特征在于,还包括:
词向量计算工具,用于将所述输入句子分为100个词,其中输入句子中多于100个词的多余部分被截掉,不足100个词的输入句子的不足部分用零补全;将所述100个词分别转换为维度为50的词向量;基于每个词的词向量生成所述输入句子的向量矩阵。
3.根据权利要求2所述的关系抽取系统,其特征在于,
所述CNN层,用于将被分类为实体有关系的句子的向量矩阵转换为维度为230的句向量;所述关系向量的数目为N;所述输出矩阵为N×230矩阵;
所述线性层,用于将所述N×230矩阵转换为N维的输出向量。
4.根据权利要求1所述的关系抽取系统,其特征在于,
所述BERT层,用于将类别为噪音句子的向量矩阵附加标签值0,将类别为实体有关系的句子的向量矩阵附加标签值1;
所述卷积神经网络CNN层,用于将标签值1的向量矩阵转换为句向量。
5.根据权利要求1所述的关系抽取系统,其特征在于,
所述关系抽取系统的损失函数为L,L=L1+L2;
其中L1为句子分类损失函数,L2为关系分类损失函数。
6.一种关系抽取方法,其特征在于,包括:
使能来自变换器的双向编码器表征量BERT层对输入句子的向量矩阵进行分类,所述分类的类别包括实体无关系的噪音句子和实体有关系的句子;
使能卷积神经网络CNN层将被分类为实体有关系的句子的向量矩阵转换为句向量;
使能注意力层计算所述句向量与关系向量之间的相似度,基于所述相似度为所述句向量设置权重,并基于所述句向量的加权求和结果得到所述关系向量的输出矩阵;
使能线性层对所述输出矩阵降维,以得到输出向量;
使能Softmax层对所述输出向量执行概率规划计算,以获取所述输入句子的关系概率分布。
7.根据权利要求6所述的关系抽取方法,其特征在于,该方法还包括:
使能词向量计算工具将所述输入句子分为100个词,其中输入句子中多于100个词的多余部分被截掉,不足100个词的输入句子的不足部分用零补全;将所述100个词分别转换为维度为50的词向量;基于每个词的词向量生成所述输入句子的向量矩阵。
8.根据权利要求6所述的关系抽取方法,其特征在于,
使能BERT层对输入句子的向量矩阵进行分类包括:使能所述BERT层将类别为噪音句子的向量矩阵附加标签值0,将类别为实体有关系的句子的向量矩阵附加标签值1;
所述使能CNN层将被分类为实体有关系的句子的向量矩阵转换为句向量包括:使能所述CNN层将标签值1的向量矩阵转换为句向量。
9.一种关系抽取装置,其特征在于,包括处理器和存储器;
所述存储器中存储有可被所述处理器执行的应用程序,用于使得所述处理器执行如权利要求6-8中任一项所述的关系抽取方法。
10.一种计算机可读存储介质,其特征在于,其中存储有计算机可读指令,该计算机可读指令用于执行如权利要求6-8中任一项所述的关系抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910556214.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高含量活性剂的水包水组合物
- 下一篇:一种新型快速换电装置