[发明专利]一种实体召回方法及实体查询系统在审
申请号: | 202210974839.X | 申请日: | 2022-08-15 |
公开(公告)号: | CN115577068A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 郭嘉丰;范意兴;王苑铮;陈薇;张儒清;程学旗 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/02 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 召回 方法 查询 系统 | ||
1.一种实体召回方法,其特征在于,包括:
S1、根据待查询实体,利用预先训练的第一编码神经网络对待查询实体进行编码,得到待查询实体的多维浮点值查询向量;
S2、将所述待查询实体的多维浮点值查询向量中每个维度的浮点值按照预设规则映射为非浮点的第一数值或者第二数值,得到多维二值查询向量;
S3、根据待查询实体的多维二值查询向量在实体知识库选取部分规范实体生成召回的候选实体集合,其中所述实体知识库包括规范化命名的多个规范实体及按照与每个规范实体对应的多维二值实体向量。
2.根据权利要求1所述的方法,其特征在于,所述实体知识库中的每个规范实体的多维二值实体向量按照以下方式预先确定:
利用预先训练的第二编码神经网络对规范实体进行编码,得到规范实体的多维浮点值实体向量;
将规范实体的多维浮点值实体向量中每个维度的浮点值按照预设规则映射为非浮点的第一数值或者第二数值,得到该规范实体的多维二值实体向量。
3.根据权利要求2所述的方法,其特征在于,所述预设规则为:
根据多维浮点值查询向量或者多维浮点值实体向量的每一维浮点值的正负号,将正号的浮点值映射为第一数值,负号的浮点值映射第二数值,以得到多维二值查询向量或得到多维二值实体向量。
4.根据权利要求2所述的方法,其特征在于,按照预设规则对多维浮点值查询向量或者多维浮点值实体向量进行如下处理:
对多维浮点值查询向量进行升维转换,得到变换浮点值查询向量,或者,对多维浮点值实体向量进行升维转换,得到变换浮点值实体向量,其中,变换浮点值查询向量和变换浮点值实体向量的维度相同;
根据提取变换浮点值查询向量或变换浮点值实体向量中的每一维浮点值的正负号,将正号的浮点值映射为第一数值,负号的浮点值映射第二数值,以得到多维二值查询向量或得到多维二值实体向量。
5.根据权利要求4所述的方法,其特征在于,所述对多维浮点值查询向量进行升维转换或对多维浮点值实体向量进行升维转换的方式包括:
获取用于升维的旋转矩阵,将多维浮点值查询向量乘以旋转矩阵,得到增加维度后的变换浮点值查询向量;或者
获取用于升维的旋转矩阵,将多维浮点值实体向量乘以旋转矩阵,得到增加维度后的变换浮点值实体向量。
6.根据权利要求5所述的方法,其特征在于,所述旋转矩阵的获得方式包括:
从满足预定的均值和方差的正态分布随机数中,采样n×m维的随机矩阵,其中,n为多维浮点值查询向量或者多维浮点值实体向量的维度,m为变换浮点值查询向量或者变换浮点值实体向量的维度,m≥n;
对所述随机矩阵进行奇异值分解,得到n×m维的旋转矩阵。
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述步骤S3中,按照以下方式生成候选实体集合:
计算待查询实体的多维二值查询向量与实体知识库中的每个规范实体的多维二值实体向量之间的汉明距离;
按照汉明距离从小到大的顺序选取预定个数的规范实体生成候选实体集合;或者
选择汉明距离小于等于预设阈值的规范实体生成候选实体集合。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述第一编码神经网络是双塔模型中的查询编码模块,第二编码神经网络是双塔模型中的实体编码模块。
9.根据权利要求1-6任一项所述的方法,其特征在于,所述第一数值为+1、第二数值为-1;或所述第一数值为1、第二数值为0。
10.一种实体查询方法,其特征在于,包括:
获取待查询实体,采用如权利要求1-9任一项所述方法召回待查询实体的候选实体集合;
计算待查询实体与候选实体集合中每个规范实体的相似度,根据相似度获得查询结果;
根据查询结果,从实体知识库返回相关的规范实体的信息,该信息包括规范实体的名称和/或规范实体的描述文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210974839.X/1.html,转载请声明来源钻瓜专利网。