[发明专利]主宾对应关系的确定方法、装置、计算机设备及存储介质在审
申请号: | 202110839668.5 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113468295A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 孙思;曹锋铭 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/126;G06N3/04;G06N3/08 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 吕梦雪 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主宾 对应 关系 确定 方法 装置 计算机 设备 存储 介质 | ||
1.一种主宾对应关系的确定方法,其特征在于,包括:
获取待预测语句;
提取所述待预测语句对应的语句特征向量;
基于所述语句特征向量输入至预设分类模型进行分类,根据分类结果预测所述待预测语句中各个字符对对应的连接关系;
基于所述各个字符对对应的连接关系,确定所述待预测语句中存在的主语和宾语,并根据所述主语和所述宾语组成的字符对对应的连接关系,判定所述主语和所述宾语之间是否存在对应关系。
2.根据权利要求1所述的方法,其特征在于,所述提取所述待预测语句对应的语句特征向量,包括:
确定所述待预测语句中包含的各个字符,并根据所述各个字符在所述待预测语句中的位置信息,确定所述各个字符对应的第一特征向量;
将所述第一特征向量输入至预设编码器中进行语句特征提取,得到所述待预测语句对应的语句特征向量。
3.根据权利要求2所述的方法,其特征在于,所述预设编码器包括注意力层和前馈神经网络层,所述将所述第一特征向量输入至预设编码器中进行语句特征提取,得到所述待预测语句对应的语句特征向量,包括:
将所述第一特征向量输入至所述注意力层中的不同注意力子空间进行特征提取,得到所述各个字符在所述不同注意力子空间下的第二特征向量;
将所述各个字符在所述不同注意力子空间下的第二特征向量与所述不同注意力子空间对应的权重相乘并求和,得到所述各个字符对应的注意力层输出向量;
将所述注意力层输出向量和所述第一特征向量相加,得到所述各个字符对应的第三特征向量;
将所述第三特征向量输入至所述前馈神经网络层中进行特征提取,得到所述待预测语句对应的语句特征向量。
4.根据权利要求3所述的方法,其特征在于,所述将所述第一特征向量输入至所述注意力层中的不同注意力子空间进行特征提取,得到所述各个字符在所述不同注意力子空间下的第二特征向量,包括:
根据所述第一特征向量,确定所述各个字符在所述不同注意力子空间下的查询向量、键向量和值向量;
将所述各个字符中的目标字符在所述不同注意力子空间下的查询向量与所述各个字符在所述不同注意力子空间下的键向量相乘,得到所述各个字符在所述不同注意力子空间下针对所述目标字符的注意力分值;
将所述各个字符在不同注意力子空间下的注意力分值和所述键向量相乘并求和,得到所述目标字符在所述不同注意力空间下的第二特征向量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述语句特征向量输入至预设分类模型进行分类,根据分类结果预测所述待预测语句中各个字符对对应的连接关系,包括:
将所述语句特征向量输入至预设分类模型中,得到所述待预测语句的各个字符中任意两个字符组成的字符对对应的关系标签;
根据所述关系标签,确定所述待预测语句中各个字符对对应的连接关系。
6.根据权利要求5所述的方法,其特征在于,所述根据所述关系标签,确定所述待预测语句中各个字符对对应的连接关系,包括:
若所述各个字符对中的目标字符对对应的关系标签为1,则确定所述目标字符对中的字符存在主语的头部字和主语的尾部字之间的连接关系或者宾语的头部字和宾语的尾部字之间的连接关系;
若所述目标字符对对应的关系标签为2,则确定所述目标字符对中的字符存在主语的头部字和宾语的头部字之间的连接关系;
若所述目标字符对对应的关系标签为3,则确定所述目标字符对中的字符存在主语的尾部字和宾语的尾部字之间的连接关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110839668.5/1.html,转载请声明来源钻瓜专利网。