[发明专利]查询处理有效
申请号: | 201880068371.X | 申请日: | 2018-10-23 |
公开(公告)号: | CN111247528B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 吉田一星 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 处理 | ||
系统、方法和计算机程序产品,被配置为执行包括以下步骤的操作:接收指定AND条件和OR条件的查询,基于AND索引结构确定语料库中的多个文档中的满足查询的AND条件的文档集合,计算文档集合中的第一文档的查询相似性得分,其中查询相似性得分基于针对查询的OR条件计算的第一散列值、OR条件的权重值以及OR索引中指定的第一文档的第二散列值,以及返回第一文档的指示和查询相似性得分,作为对查询的响应。
背景技术
本发明涉及查询处理。
搜索查询通常包括大量条件。条件的类型可以包括合取条件(例如,猫AND狗)和析取条件(例如,苹果OR橙子)。用于处理搜索查询的常规技术通常针对一种类型的查询条件来优化。例如,可以有效地处理合取条件的数据结构在处理析取条件时不是有效的。此外,由于它们的性质,有效处理析取条件的数据结构不能以准确的方式处理合取条件。由于查询条件可以计数到数百、数千或更多,因此传统技术不能有效地处理包括两种类型的条件的查询。
发明内容
本发明的实施例涉及查询处理,并且更具体地,涉及用于相似性搜索的查询的析取条件和合取条件的混合处理。
根据本发明的一个实施例,一种方法包括:接收指定AND条件和OR条件的查询;基于AND索引结构,确定语料库中的多个文档中的满足查询的AND条件的文档集合;计算文档集合中的第一文档的查询相似性得分,其中查询相似性得分基于针对查询的OR条件计算的第一散列值、OR条件的权重值以及OR索引中指定的第一文档的第二散列值;以及返回第一文档的指示和查询相似性得分作为对查询的响应。
在另一实施例中,一种系统包括处理器和包含程序的存储器,程序在由处理器执行时执行操作,该操作包括:接收指定AND条件和OR条件的查询;基于AND索引结构,确定语料库中的多个文档中的满足查询的AND条件的文档集合;计算文档集合中的第一文档的查询相似性得分,其中查询相似性得分基于针对查询的OR条件计算的第一散列值、OR条件的权重值、以及OR索引中指定的第一文档的第二散列值;以及返回第一文档的指示和查询相似性得分,作为对查询的响应。
在另一实施例中,一种非暂时性计算机可读介质存储指令,当由处理器执行时,所述指令执行操作,所述操作包括:接收指定AND条件和OR条件的查询,基于AND索引结构,确定语料库中的多个文档中的满足查询的AND条件的文档集合;计算文档集合中的第一文档的查询相似性得分,其中查询相似性得分基于针对查询的OR条件计算的第一散列值、OR条件的权重值、以及OR索引中指定的第一文档的第二散列值,以及返回第一文档的指示和查询相似性得分,作为对查询的响应。
附图说明
现在将参考附图仅通过示例的方式描述本发明的实施例,在附图中:
图1示出了根据一个实施例的实现用于相似性搜索的搜索查询的析取条件和合取条件的混合处理的查询处理系统。
图2是示出根据一个实施例的用于相似性搜索的搜索查询的析取条件和合取条件的混合处理的方法的流程图。
图3是示出根据一个实施例的用于文档预处理的方法的流程图。
图4是示出根据一个实施例的使用析取条件和合取条件的混合处理来处理查询的方法的流程图。
图5是示出根据一个实施例的生成满足查询中的每个AND条件的每个文档的文档列表的方法的流程图。
图6是示出根据一个实施例的计算文档相对于查询中的所有OR条件的相似性得分的方法的流程图。
图7示出了根据一个实施例的实现用于相似性搜索的搜索查询的析取条件和合取条件的混合处理的系统。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880068371.X/2.html,转载请声明来源钻瓜专利网。