[发明专利]语义召回方法、装置、计算机设备及存储介质在审
申请号: | 202010402690.9 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111767375A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 骆迅 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 召回 方法 装置 计算机 设备 存储 介质 | ||
1.一种语义召回方法,其特征在于,包括下述步骤:
在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;
获取存储的候选句向量;
基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;
根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。
2.根据权利要求1所述的语义召回方法,其特征在于,所述基于句向量生成器获取所述线上查询数据对应的线上句向量的步骤包括:
基于句向量生成器,获取所述线上查询数据的字向量;
对所述字向量进行多层卷积处理,得到所述线上查询数据的线上句向量。
3.根据权利要求2所述的语义召回方法,其特征在于,所述基于句向量生成器,获取所述线上查询数据的字向量的步骤包括:
基于句向量生成器的标记解析层对所述线上查询数据中的每个字进行ID化处理,得到所述线上查询数据中的每个字对应的ID;
基于所述句向量生成器的嵌入层对所述ID进行特征编码,得到所述线上查询数据中每个字对应的字向量。
4.根据权利要求2所述的语义召回方法,其特征在于,所述对所述字向量进行多层卷积处理,得到所述线上查询数据的线上句向量的步骤包括:
基于卷积神经网络对所述字向量进行多层卷积处理,得到所述线上查询数据对应的语义特征;
将每次得到的所述语义特征拼接在一起,得到所述线上查询数据的线上句向量。
5.根据权利要求1所述的语义召回方法,其特征在于,所述获取存储的候选句向量的步骤包括:
获取问题库中存储的候选问题;
基于所述句向量生成器对所述候选问题进行离线计算,得到所述候选问题对应的候选句向量。
6.根据权利要求5所述的语义召回方法,其特征在于,所述基于所述句向量生成器对所述候选问题进行离线计算,得到所述候选问题对应的候选句向量的步骤之后,还包括:
获取每个所述候选句向量对应的唯一标识信息;
根据所述标识信息,将所述候选句向量以字典的形式,与所述候选问题关联存储至数据库中。
7.根据权利要求1至6任意一项所述的语义召回方法,其特征在于,所述基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度的步骤包括:
计算所述线上句向量和所述候选句向量在乘法、减法和最大值三个衡量维度上的差异特征向量;
将所述三个衡量维度上的差异特征向量拼接在一起,得到最终的差异特征向量;
对所述最终的差异特征向量进行正则化处理,得到处理结果;
对所述处理结果进行函数处理,得到所述线上句向量和所述候选句向量之间的相似度。
8.一种语义召回装置,其特征在于,包括:
第一获取模块,用于在接收到线上查询数据时,基于句向量生成器获取所述线上查询数据对应的线上句向量;
第二获取模块,用于获取存储的候选句向量;
拼接模块,用于基于句向量拼接器匹配所述线上句向量和所述候选句向量,得到所述线上句向量和所述候选句向量的相似度;
排序模块,用于根据所述相似度对所述候选句向量进行降序排序,并返回排序第一的候选句向量对应的候选问题的答案作为正确答案。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的语义召回方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的语义召回方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010402690.9/1.html,转载请声明来源钻瓜专利网。