[发明专利]Ranked反近邻空间关键字查询方法及装置在审
申请号: | 201510810908.3 | 申请日: | 2015-11-20 |
公开(公告)号: | CN105404675A | 公开(公告)日: | 2016-03-16 |
发明(设计)人: | 赵朋朋;方海林;许佳捷;周晓方 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ranked 近邻 空间 关键字 查询 方法 装置 | ||
1.一种Ranked反近邻空间关键字查询方法,其特征在于,包括:
获取预先构建的倒排索引及查询条件;其中,所述倒排索引是为源数据集构建的倒排索引,所述源数据集中包括若干源数据,源数据包含文本属性及空间属性,所述倒排索引用于记录文本属性与源数据之间的映射关系,所述查询条件中包含查询关键字和空间信息;
利用所述倒排索引,在所述源数据集中,查找包含所述查询关键字的目标源数据,并将查找到的目标源数据确定为候选数据;;
利用预先构建的R-tree树形索引,确定各个所述候选数据与所述查询条件在空间距离上的远近顺序,并按照从近到远的顺序,在所述R-tree树形索引中,依次查找各个所述候选数据所在的目标叶子节点;其中,所述R-tree树形索引是依据所述源数据集中的空间属性构建的空间索引,记录所述源数据集中各个源数据之间的距离关系;
依据二分面垂直面算法,计算所述目标叶子节点包含的所述候选数据对所述查询条件的空间影响度;
依据空间影响度的大小,对所述若干候选数据进行排序,并依据空间影响度的大小排序,将排序在前或在后的预设数量的所述候选数据确定为目标数据。
2.根据权利要求1所述的Ranked反近邻空间关键字查询方法,其特征在于,还包括:
若所述空间影响度相同,则将与查询条件之间的距离较小的候选数据排序在前,将与查询条件之间的距离较大的候选数据排序在后。
3.根据权利要求1所述的Ranked反近邻空间关键字查询方法,其特征在于,所述依据二分面垂直面算法,计算每个所述目标叶子节点包含的所述候选数据对所述查询条件的空间影响度,包括:
对每个所述目标叶子节点分别执行以下步骤,以获得各个所述目标叶子节点中包含的所述候选数据对所述查询条件的空间影响度:
依据所述目标叶子节点中包含的目标候选数据的空间属性及所述查询条件的空间信息,生成二分垂直线,以获得两个二分面;其中,所述目标候选数据及所述查询条件分别在不同的二分面内,所述目标候选数据之外的其他候选数据在所述二分面内;
计算所述其他候选数据与所述目标候选数据的第一距离、以及所述其他候选数据与所述查询条件之间的第二距离;
若所述第一距离大于所述第二距离,则更新所述其他候选数据的空间影响度。
4.一种Ranked反近邻空间关键字查询方法,其特征在于,包括:
获取预先构建的InvSR-tree混合树形索引及查询条件;其中,所述InvSR-tree混合树形索引在R-tree树形索引的每个节点具有各自的签名文件,签名文件是由节点包含的源数据的文本属性生成的签名文件,所述查询条件中包含查询关键字及空间信息,且InvSR-tree混合树形索引的每个叶子节点具有各自的倒排索引,倒排索引用于记录叶子节点包含的源数据的文本属性与源数据之间的映射关系;
在所述InvSR-tree混合树形索引中,查找与所述空间信息距离满足预设距离条件、且签名文件中包含所述查询关键字的目标叶子节点;
加载所述目标叶子节点的目标倒排索引,并在所述目标倒排索引中,查找包含所述查询关键字的目标文本属性,并将所述目标文本属性映射的源数据确定为候选数据;
依据二分面垂直面算法,计算所述候选数据对所述查询条件的空间影响度,在所述候选数据为多个的情况下,依据空间影响度的大小,对多个所述候选数据进行排序,并将排序在前或在后的预设数量的所述候选数据确定为目标数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510810908.3/1.html,转载请声明来源钻瓜专利网。