[发明专利]一种处理地理文本Skyline查询的混合空间索引方法有效
申请号: | 201710961027.0 | 申请日: | 2017-10-12 |
公开(公告)号: | CN108052514B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 郑吉平;张智明;张丝曼 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31 |
代理公司: | 盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙) 32454 | 代理人: | 葛潇敏 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 地理 文本 skyline 查询 混合 空间 索引 方法 | ||
本发明是一种处理地理文本Skyline查询的混合空间索引机制,其中地理文本Skyline查询指的是对地理文本信息数据集实施Skyline查询。其中,地理文本数据集中的数据点同时包含地理位置信息和关键词文本信息。Inverted‑Merged R*‑Tree树(IMR*‑T)融合了R*树以及Inverted File的思想,该发明属于计算机科学中的查询索引领域。本发明致力于解决对于地理文本数据集的存储和针对该数据集进行Skyline查询的问题,在保证合理存储前提下,提升Skyline查询效率。本发明借助R*树构造策略,依据数据点空间位置分布构造多叉树,并为树的叶子节点构造Inverted File。为了提高对数据集的裁剪效率,树节点中还存储了边界框架信息。本发明广泛适用于地理文本Skyline查询的相关应用场景。
技术领域
本发明涉及一种处理地理文本Skyline查询的混合空间索引方法,具体涉及针对包含关键词文本属性与地理空间位置属性的数据集的有效组织存储和针对该数据集的Skyline查询,属于计算机科学中的查询索引领域。
背景技术
随着社交网络的迅速发展,大量的附带文本关键词标签的数据(Geo-TextualData)随之产生。例如,用户在新浪微博中发布的个人微博状态(附带着地理位置和微博标签信息),餐馆在美团app上发布的饭店信息(附带着饭店的地理位置信息以及打折信息、菜品信息等)。这些数据主要包含了两个维度的信息:地理位置信息和关键词信息。针对数据点的地理空间位置信息,当前的研究中主要采用R*树结构对数据点进行有效的组织和存储,R*树的核心思想是依据数据点的空间位置分布,对分布较近的数据点进行聚合从而构造多叉索引树,其中所有的数据点都存储在多叉索引树的叶子节点中。
针对同时包含了地理空间位置以及关键词文本信息的数据集合,Beckmann.N等人[1]提出了R树结构存储空间数据点,R树的核心思想就是尽可能的把空间位置比较靠近的数据点进行聚合。Wang等人[2]提出了AP(Adaptive spatial-textual Partition Tree)树索引结构用于处理基于数据流的连续空间关键词查询(Continues Spatial-KeywordQueries Over Streams)。之前的处理空间关键词的索引结构要么采用空间属性优先进行构造,要么采用关键词属性优先进行构造。然而在实际构造索引的过程中,两个方案优劣性并不是一成不变的,因此为了进一步提高索引的处理效率,提出了AP树结构,该结构依据代价评估函数实时动态的在两种方案中选择代价最小的方案进行子索引结构的构造,从而极大提高索引处理效率。Chen等人[3]提出了IR树(Inverted-R Tree)索引机制对数据点进行有效的组织和存储,该索引树是采用R树对于数据点的空间划分的策略对数据点进行空间划分。与此同时,索引树中的每一个节点(包括叶子节点和中间节点)都对应一个InvertedFile存储该节点中所有数据点的关键词信息。
R树的缺陷主要是无法有效的解决索引节点冲突的问题,而AP树的缺陷集中在他的构造过程极为麻烦,构造的代价比较大,最后IR树的主要缺陷是其每一个节点都有一个对应的Inverted File,这使得IR树的空间存储代价过大。
上文中提到的专利申请情况如下:
[1]基于负载均衡和查询日志的数据空间多维索引方法(申请日期:2016-06-13,公开号:CN106095951A)
[2]多层次混合的三维空间索引方法(申请日期:2012-12-29,公开号:CN103092926A)
[3]基于hbase和geohash的矢量数据空间索引方法(申请日期:2014-9-29,公开号:CN104199986A)
上文中提到的文献来源于如下的会议或期刊:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710961027.0/2.html,转载请声明来源钻瓜专利网。