[发明专利]问答匹配和搜索方法、设备、系统及存储介质在审
申请号: | 201910739811.6 | 申请日: | 2019-08-12 |
公开(公告)号: | CN112395396A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 谢韬;秦昌博 | 申请(专利权)人: | 科沃斯商用机器人有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 张爱;刘戈 |
地址: | 215104 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 匹配 搜索 方法 设备 系统 存储 介质 | ||
1.一种问答匹配方法,其特征在于,包括:
获取待匹配问题;
将所述待匹配问题进行向量化处理,得到问题向量;
将所述问题向量在已知答案向量中进行检索,以得到至少一个候选答案向量;
从所述至少一个候选答案向量对应的答案中,获取所述待匹配问题的答案。
2.根据权利要求1所述的方法,其特征在于,所述将所述问题向量在已知答案向量中进行检索,以得到至少一个候选答案向量,包括:
根据指定的候选答案数量,从多层答案空间中确定所述问题向量所属的目标答案子空间,其中,所述已知答案向量被划分至多层答案空间中;
从所述目标答案子空间包含的各答案向量中,选择所述至少一个候选答案向量。
3.根据权利要求2所述的方法,其特征在于,所述多层答案空间形成一棵二叉树,所述二叉树的根节点表示已知答案向量构成的全空间,二叉树上每一层中对应同一父结点的左右子树分别表示所述父结点对应的答案空间划分为的两个答案子空间。
4.根据权利要求3所述的方法,其特征在于,所述根据指定的候选答案数量,从多层答案空间中确定所述问题向量所属的目标答案子空间,包括:
根据所述问题向量与所述二叉树上各层左右子树对应的超平面之间的几何关系,确定对所述二叉树的遍历方向,并沿着所述遍历方向对所述二叉树进行遍历,直到找到所表示的答案子空间包含的答案向量的数量小于所述指定的候选答案数量的目标子树为止;
将所述目标子树的父结点代表的答案子空间作为所述问题向量所属的目标答案子空间。
5.根据权利要求2所述的方法,其特征在于,在根据指定的候选答案数量,从多层答案空间中确定所述问题向量所属的目标答案子空间之前,所述方法还包括:
利用近似最近邻算法,对所述已知答案向量进行空间划分,以得到所述多层答案空间。
6.根据权利要求2所述的方法,其特征在于,所述从所述目标答案子空间包含的各答案向量中,选择所述至少一个候选答案向量,包括:
计算所述目标答案子空间包含的各答案向量分别与所述问题向量的相似度;
根据所述目标答案子空间包含的答案向量分别与所述问题特征向量的相似度,从所述目标答案子空间中的答案特征向量中选择所述至少一个候选答案特征向量。
7.根据权利要求1所述的方法,其特征在于,所述从所述至少一个候选答案向量对应的答案中,获取所述待匹配问题的答案,包括:
计算所述至少一个候选答案向量对应的答案分别与所述待匹配问题的相关性得分;
从所述至少一个候选答案向量对应的答案中,选择最高相关性得分对应的答案,作为所述待匹配问题的答案。
8.根据权利要求7所述的方法,其特征在于,所述计算所述至少一个候选答案向量对应的答案分别与所述待匹配问题的相关性得分,包括:
将所述至少一个候选答案向量对应的答案和所述待匹配问题输入排序模型;
利用所述排序模型,计算所述至少一个候选答案向量对应的答案分别与所述待匹配问题的相关性得分。
9.根据权利要求8所述的方法,其特征在于,在将所述至少一个候选答案向量对应的答案和所述待匹配问题输入排序模型之前,所述方法还包括:
以损失函数最小化为训练目标,利用样本问答对进行模型训练,得到所述排序模型;
所述损失函数是根据模型训练得到的所述样本问答对中各问题与其答案的相关性得分以及所述样本问答对中各问题与其答案的实际相关性得分确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科沃斯商用机器人有限公司,未经科沃斯商用机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910739811.6/1.html,转载请声明来源钻瓜专利网。