[发明专利]Ranked反近邻空间关键字查询方法及装置在审
申请号: | 201510810908.3 | 申请日: | 2015-11-20 |
公开(公告)号: | CN105404675A | 公开(公告)日: | 2016-03-16 |
发明(设计)人: | 赵朋朋;方海林;许佳捷;周晓方 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ranked 近邻 空间 关键字 查询 方法 装置 | ||
技术领域
本申请涉及近邻查询技术领域,更具体地,涉及Ranked反近邻空间关键字查询方法及装置。
背景技术
近年来,反K近邻查询是一种常用的数据查询方法,用于依据预先设置的查询目标,对大量的数据进行分析判断,以查询出与查询目标具有关联关系的数据。具体地,反K近邻查询方法的一个应用领域是,对大量具有空间特征的文本属性进行查询,获得与某个空间地点具有关联性的文本属性。
例如,人们可以发布微博,评论,签到等数据,这些数据通常带有地理位置信息和文本描述。这些数据中隐含着潜在信息,例如假设想要对某些用户推送A餐厅的就餐信息,则可以使用反K近邻查询方法来查询出哪些用户是A餐厅的潜在用户,具体地,反K近邻空间关键字查询查找距离A餐厅附近,且内容是对A餐厅食物进行评论的微博,将发布这些微博数据的用户作为目标用户。在该查询场景中,A餐厅及A餐厅的地址即是查询目标信息,微博及微博的发布地址即是待查询数据。
然而,目前几种常见的反K近邻查询方法并不能确定查询结果对查询条件的影响程度。
发明内容
有鉴于此,本申请提供了一种基于Ranked反k近邻空间关键字查询的Ranked反近邻空间关键字查询方法,可以将查询结果按照对查询的影响程度大小进行排序。另外,本申请还提供了一种Ranked反近邻空间关键字查询装置,用以保证所述方法在实际中的应用及实现。
为实现所述目的,本申请提供的技术方案如下:
本申请的第一方面提供了一种Ranked反近邻空间关键字查询方法,包括:
获取预先构建的倒排索引及查询条件;其中,所述倒排索引是为源数据集构建的倒排索引,所述源数据集中包括若干源数据,源数据包含文本属性及空间属性,所述倒排索引用于记录文本属性与源数据之间的映射关系,所述查询条件中包含查询关键字和空间信息;
利用所述倒排索引,在所述源数据集中,查找包含所述查询关键字的目标源数据,并将查找到的目标源数据确定为候选数据;;
利用预先构建的R-tree树形索引,确定各个所述候选数据与所述查询条件在空间距离上的远近顺序,并按照从近到远的顺序,在所述R-tree树形索引中,依次查找各个所述候选数据所在的目标叶子节点;其中,所述R-tree树形索引是依据所述源数据集中的空间属性构建的空间索引,记录所述源数据集中各个源数据之间的距离关系;
依据二分面垂直面算法,计算所述目标叶子节点包含的所述候选数据对所述查询条件的空间影响度;
依据空间影响度的大小,对所述若干候选数据进行排序,并依据空间影响度的大小排序,将排序在前或在后的预设数量的所述候选数据确定为目标数据。
本申请的第二方面提供了一种Ranked反近邻空间关键字查询方法,包括:
获取预先构建的InvSR-tree混合树形索引及查询条件;其中,所述InvSR-tree混合树形索引在R-tree树形索引的每个节点具有各自的签名文件,签名文件是由节点包含的源数据的文本属性生成的签名文件,所述查询条件中包含查询关键字及空间信息,且InvSR-tree混合树形索引的每个叶子节点具有各自的倒排索引,倒排索引用于记录叶子节点包含的源数据的文本属性与源数据之间的映射关系;
在所述InvSR-tree混合树形索引中,查找与所述空间信息距离满足预设距离条件、且签名文件中包含所述查询关键字的目标叶子节点;
加载所述目标叶子节点的目标倒排索引,并在所述目标倒排索引中,查找包含所述查询关键字的目标文本属性,并将所述目标文本属性映射的源数据确定为候选数据;
依据二分面垂直面算法,计算所述候选数据对所述查询条件的空间影响度,在所述候选数据为多个的情况下,依据空间影响度的大小,对多个所述候选数据进行排序,并将排序在前或在后的预设数量的所述候选数据确定为目标数据。
本申请的第三方面提供了一种Ranked反近邻空间关键字查询装置,包括:
第一倒排索引及查询获取模块,用于获取预先构建的倒排索引及查询条件;其中,所述倒排索引是为源数据集构建的倒排索引,所述源数据集中包括若干源数据,源数据包括文本属性及空间属性,所述倒排索引用于记录文本属性与源数据之间的映射关系,所述查询条件中包含查询关键字及空间信息;
第一候选数据查找模块,用于利用所述倒排索引,在所述源数据集中,查找包含所述查询关键字的目标源数据,并将查找到的目标源数据确定为候选数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510810908.3/2.html,转载请声明来源钻瓜专利网。