[发明专利]关系抽取方法、装置、设备、存储介质及计算机程序产品在审
申请号: | 202210279697.5 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114625888A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 杨韬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/216;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 彭程 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关系 抽取 方法 装置 设备 存储 介质 计算机 程序 产品 | ||
1.一种关系抽取方法,其特征在于,包括:
获取待处理文本中各个待处理字符的表征信息;
在预测所述待处理文本对应的实体关系序列中的第i个预测字符时,确定生成所述第i个预测字符所需的表征信息;i为正整数;
基于所述生成所述第i个预测字符所需的表征信息,确定预设词表中各个参考字符作为所述第i个预测字符的生成概率;所述待处理文本中的各个待处理字符属于所述预设词表;
基于所述生成所述第i个预测字符所需的表征信息与所述各个待处理字符的表征信息之间的相似度,确定所述各个待处理字符作为所述第i个预测字符的指针概率;
根据所述各个参考字符作为所述第i个预测字符的生成概率以及所述各个待处理字符作为所述第i个预测字符的指针概率,从所述预设词表中确定出所述第i个预测字符,并将所述第i个预测字符添加至所述待处理文本对应的实体关系序列中。
2.如权利要求1所述的方法,其特征在于,所述根据所述各个参考字符作为所述第i个预测字符的生成概率以及所述各个待处理字符作为所述第i个预测字符的指针概率,从所述预设词表中确定出所述第i个预测字符,包括:
获取生成概率权重以及指针概率权重;所述生成概率权重是基于所述生成所述第i个预测字符所需的表征信息确定出的,所述生成概率权重与所述指针概率权重相加为1;
将所述生成概率权重分别与所述各个参考字符作为所述第i个预测字符的生成概率进行相乘运算,得到所述各个参考字符对应的加权生成概率,以及将所述指针概率权重分别与所述各个待处理字符作为所述第i个预测字符的指针概率进行相乘运算,得到所述各个待处理字符对应的加权指针概率;
将所述各个参考字符对应的加权生成概率与所述各个待处理字符对应的加权指针概率对应相加,得到所述各个参考字符作为所述第i个预测字符的预测概率,并将所述预设词表中,满足预测概率条件的预测概率所指向的参考字符确定为所述第i个预测字符。
3.如权利要求2所述的方法,其特征在于,所述各个参考字符包括所述各个待处理字符以及其他字符;所述各个参考字符对应的加权生成概率包括所述各个待处理字符对应的加权生成概率以及所述其他字符对应的加权生成概率;
所述将所述各个参考字符对应的加权生成概率与所述各个待处理字符对应的加权指针概率对应相加,得到所述各个参考字符作为所述第i个预测字符的预测概率,包括:
将每个所述待处理字符对应的加权生成概率与所述每个待处理字符对应的加权指针概率对应进行求和处理,得到所述每个待处理字符作为所述第i个预测字符的预测概率;
将所述其他字符对应的加权生成概率,确定为所述其他字符作为所述第i个预测字符的预测概率。
4.如权利要求1所述的方法,其特征在于,所述各个待处理字符的表征信息包括所述各个待处理字符的表征向量,所述生成所述第i个预测字符所需的表征信息包括生成所述第i个预测字符所需的表征向量;所述各个待处理字符的表征向量是调用关系抽取模型中的编码模块,对所述待处理文本进行关系特征编码处理得到的;所述关系抽取模型还包括解码模块,所述生成所述第i个预测字符所需的表征向量是调用所述关系抽取模型中的解码模块,对所述各个待处理字符的表征向量以及解码参考字符进行解码处理得到的,其中,当i=1时,所述解码参考字符为特殊解码字符,当i>1时,所述解码参考字符为第i-1个预测字符。
5.如权利要求1所述的方法,其特征在于,所述各个待处理字符的表征信息包括所述各个待处理字符的表征向量,所述生成所述第i个预测字符所需的表征信息包括生成所述第i个预测字符所需的表征向量;
所述基于所述生成所述第i个预测字符所需的表征信息与所述各个待处理字符的表征信息之间的相似度,确定所述各个待处理字符作为所述第i个预测字符的指针概率,包括:
将所述各个待处理字符的表征向量与所述生成第i个预测字符所需的表征向量进行内积处理,得到所述生成第i个预测字符所需的表征向量与所述各个待处理字符的表征向量之间的相似度分布;
对所述相似度分布进行归一化处理,得到所述各个待处理字符作为所述第i个预测字符的指针概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210279697.5/1.html,转载请声明来源钻瓜专利网。