[发明专利]Top-k集合空间关键字近似查询方法在审
申请号: | 202111128707.7 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113779039A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 孟祥福;王丹丹;张霄雁 | 申请(专利权)人: | 辽宁工程技术大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2453;G06F16/2455;G06F16/2457;G06F16/2458;G06F16/29 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 |
地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | top 集合 空间 关键字 近似 查询 方法 | ||
本发明公开了一种Top‑k集合空间关键字近似查询方法,步骤为:对于空间对象数据集中不包含任意一个查询关键字的空间对象进行剪枝,将剩余的空间对象根据其到查询位置的欧式距离对其进行升序排序,然后将相关空间对象构建成VP‑Tree;利用VP‑Tree加速搜索空间对象的局部邻域;利用评分函数计算其综合距离分数,并按综合得分选出Top‑k组空间对象作为最终结果。本发明提出的空间对象关联度评估方法具有较高的准确性,提出的剪枝策略具有较高的执行效率,获取的Top‑k组空间对象具有较高的用户满意度。
技术领域
本发明属于空间关键字查询和局部邻域搜索的技术领域,尤其涉及一种Top-k集合空间关键字近似查询方法。
背景技术
随着GPS定位和移动网络技术的不断发展以及智能设备的普及应用,Web上出现了大量包含位置信息和文本信息的空间-文本对象(后文简称空间对象),进而使得基于位置的服务(Location Based Service,LBS)得到了广泛应用。近年来,有学者提出以一组空间对象作为空间关键字查询结果的基本单元,这组空间对象的特征联合起来以满足用户的查询需求,这种查询方法称为集合空间关键字查询(CSKQ,Collective Spatial KeywordQuery),该类方法在空间数据库查询领域逐渐受到关注。CSKQ的基本思想是,给定一个空间关键字查询条件(包括查询位置和查询关键字),以最小的代价查找一组对象,该组对象需要满足如下3个基本条件:1)能够覆盖所有查询关键字,2)组内对象与查询位置接近,3)组内对象之间位置相互接近。
虽然目前已有一些CSKQ方法,但这些方法存在以下不足。
首先,查询结果仅提供一组空间对象,但实际应用中返回Top-k组对象可为用户提供更多的选择。
其次,没有考虑组内空间对象之间的关联访问程度,而在现实中位置临近的不同类型对象之间通常具有密切的关联访问关系,例如旅游景点与其周边的酒店和餐厅经常被用户关联访问,关联访问度越大,用户越有可能同时访问这些对象,得到的结果也越符合用户的需求。
最后,集合空间关键字精确查询往往需要枚举目标数据集中所有对象的所有可能组合,这将导致计算量非常庞大,进而影响查询响应速度。
空间关键字查询方法的研究已经从多个方面展开,但它们重点在于查找单个空间对象作为结果,并且现有的集合空间关键字方法也大多仅根据距离关系检索结果。同时,上述集合空间关键字查询方法忽略了空间对象之间的关联关系,这可能使查询结果不能让用户满意。
发明内容
基于以上现有技术的不足,本发明所解决的技术问题在于提供一种Top-k集合空间关键字近似查询方法,建立一种集合空间关键字近似查询处理模型,并提出有效的剪枝策略,以提高查询效率,设计了一种新的评分函数,综合考虑距离和空间对象之间的关联访问度,据此评价候选结果,并提出了关联访问度的评估方法,在此基础上,提出了一种基于VP-Tree的剪枝策略,以提高索引速度。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明的Top-k集合空间关键字近似查询方法包括以下步骤:
步骤1:对于空间对象数据集中不包含任意一个查询关键字的空间对象进行剪枝,将剩余的空间对象根据其到查询位置的欧式距离对其进行升序排序,然后将相关空间对象构建成VP-Tree;
步骤2:利用VP-Tree加速搜索空间对象的局部邻域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111128707.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:脚刹机构及承载底座
- 下一篇:一种用于纸面的处理方法