[发明专利]一种通过扩展查询提升检索召回率的方法及系统在审
申请号: | 201910905592.4 | 申请日: | 2019-09-24 |
公开(公告)号: | CN111078993A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 杨博文;俞梦洁;张志齐 | 申请(专利权)人: | 上海依图网络科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 唐嘉伟 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 扩展 查询 提升 检索 召回 方法 系统 | ||
本发明公开了一种通过扩展查询提升检索召回率的方法及系统,其中,包括以下步骤:步骤1:根据第一阈值在数据库内进行第一轮检索问题的检索并生成第一轮检索结果;步骤2:使用过滤阈值对第一轮检索结果进行过滤生成第二轮检索问题;步骤3:根据第二阈值在数据库内进行第二轮检索问题的检索并生成第二轮检索结果;步骤4:将第一轮检索结果与第二轮检索结果合并并在合并过滤阈值中进行过滤,得到第三轮检索结果,能够对检索问题进行两次检索,并进行过滤,确保最后检索结果数据的准确性,降低检索中识别模型的不稳定性,提升检索性能。
技术领域
本发明涉及一种通过扩展查询提升检索召回率的方法及系统领域,具体涉及一种通过扩展查询提升检索召回率的方法及系统。
背景技术
现有的检索是通过计算请求与布控库中数据相似度进行排序完成,当请求与某条同人数据直接相似度不够高时,将无法检索到这条数据,使得检索中识别模型不具有较强的稳定性,降低了检索性能,因此需要一种能够弥补识别算法性能缺陷,提升检索召回率的方法及系统。
发明内容
本发明要解决的技术问题是提供一种通过扩展查询提升检索召回率的方法,能够对检索问题进行两次检索,并进行过滤,确保最后检索结果数据的准确性,降低检索中识别模型的不稳定性,提升检索性能,用以解决现有技术导致的缺陷。
本发明还提供一种通过扩展查询提升检索召回率的系统。
为解决上述技术问题本发明提供以下的技术方案:一种通过扩展查询提升检索召回率的方法,其中,包括以下步骤:
步骤1:根据第一阈值在数据库内进行第一轮检索问题的检索并生成第一轮检索结果;
步骤2:使用过滤阈值对第一轮检索结果进行过滤生成第二轮检索问题;
步骤3:根据第二阈值在数据库内进行第二轮检索问题的检索并生成第二轮检索结果;
步骤4:将第一轮检索结果与第二轮检索结果合并并在合并过滤阈值中进行过滤,得到第三轮检索结果。
在本发明的一个或多个具体实施方式中,优选地,可以在步骤4中进一步进行相似度处理,该相似度处理用以计算上述第一轮检索结果与上述第二轮检索结果之间的相似度。
一种通过扩展查询提升检索召回率的系统,其中,包括数据库、检索模块、过滤模块;
所述数据库用于与所述检索模块、所述过滤模块创建连接实现数据交互;
所述检索模块用于与所述数据库创建连接进行第一轮检索问题在所述第一阈值中的检索并生成传输至所述过滤模块的第一轮检索结果;
所述过滤模块用于将接收的所述第一轮检索结果进行过滤阈值的过滤生成传输至所述检索模块的第二轮检索问题;
所述检索模块接收所述第二轮检索问题并在所述数据库进行第二轮检索问题在所述第二阈值中的检索并生成传输至所述过滤模块的第二轮检索结果;
所述过滤模块接收所述第二轮检索结果并与所述第一轮检索结果进行合并,合并后的所述第一轮检索结果与所述第二轮检索结果在合并过滤阈值中进行过滤生成第三轮检索结果。
上述的一种通过扩展查询提升检索召回率的系统,其中,所述过滤模块内置有相似度处理模块,所述相似度处理模块用于计算所述第一轮检索结果与所述第二轮检索结果之间的相似度。
上述本发明一种通过扩展查询提升检索召回率的方法及系统提供的技术方案具有以下技术效果:
能够对检索问题进行两次检索,并进行过滤,确保最后检索结果数据的准确性,降低检索中识别模型的不稳定性,提升检索性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司,未经上海依图网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910905592.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电磁波屏蔽膜及其制备方法与用途
- 下一篇:一种用于单芯片减薄的工装及方法