[发明专利]一种基于倒排文本的带关系属性的空间查询优化方法在审
申请号: | 201910575917.7 | 申请日: | 2019-06-28 |
公开(公告)号: | CN111475599A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 刘亮;王海峰;王益挺;万杰 | 申请(专利权)人: | 国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/387;G06F16/33;G06F16/29;G06F16/22;G06F16/2453 |
代理公司: | 南京业腾知识产权代理事务所(特殊普通合伙) 32321 | 代理人: | 缪友益 |
地址: | 210008 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 关系 属性 空间 查询 优化 方法 | ||
本发明公开一种基于倒排文本的带关系属性的空间查询优化方法,包括如下步骤:(1)采用倒排文件的方式,构建带关系属性的空间索引;(2)接收来自用户的范围查询请求,将查询语句拆分为空间位置信息查询和关系属性查询两个部分,拆分完的两个子查询语句再转换成Query格式语句用AND连接通过构建的空间索引进行查询。本发明给出了带关系属性的空间数据的索引技术,相较传统的大数据空间索引,查询效率更高,同时基于该索引技术优化了对应的空间查询算法,实现针对带关系属性的空间数据的查询和分析。
技术领域
本发明涉及计算机数据库中的空间数据管理技术领域,具体是涉及一种基于倒排文本的带关系属性的空间查询优化方法。
背景技术
近几年来,随着互联网和移动技术的进步,人们能够随时随地接收和发送带有地理信息的消息,空间数据量也越来越庞大。同时,景点、酒店这一类除了有空间对象本身的地理位置信息外,还拥有关系属性,比如票价、房价、运营时间等包含数值点属性和数值段属性的对象的出现,给游客的行程规划提供了更详细的地理参考信息,但是随着全球旅游信息集的建立,查询空间变得越来越大,因此需要对包含地理位置、关系属性的混合数据进行高效索引和查询。
在旅游app上查询分析景点数据集有助于游客合理规划旅游路线,提升用户体验,该数据集的形式是带关系属性的空间数据。传统空间查询技术不适用于对这种数据进行查询分析。当前对带关系属性的空间数据查询的研究主要集中于针对地理信息和关系属性信息分别构建不同的索引,并且大都只考虑单机环境,存在如下问题:(1)由于索引对象有多个纬度,因此构建方法较为复杂,难以实现;(2)对于达到TB级甚至PB级的数据量,传统单机处理模式已不能满足查询性能要求。因此,基于高效索引方式对带关系属性的空间数据进行查询是当前需要克服的难题。
现有关于带关系属性的空间查询的研究比较少,考虑到空间查询中有一类是关于空间关键字查询技术的研究,即在空间查询基础上,增加了对关键字的文本查询,与带关系属性的空间查询比较类似,因此对这方面的研究作出如下介绍。
目前常用的关键字索引结构为倒排文件([1]KHODAEI A,SHAHABI C,LI C.HybridIndexing and Seamless Ranking of Spatial and Textual Features of WebDocuments[C].DEXA’10:Proceedings of the 21st International Conference onDatabase and Expert Systems Applications:Part I.Berlin,Heidelberg:Springer-Verlag,2010:450–466.[2]CHRISTOFORAKI M,HE J,DIMOPOULOS C,et al.Text VS.Space:Efficient Geo-Search Query Processing[C].CIKM’11:Proceedings of the 20th ACMInternational Conference on Information and Knowledge Management.New York,NY,USA:ACM,2011:423–432.[3]GOBEL R,HENRICH A,NIEMANN R,et al.A Hybrid IndexStructure for Geo-Textual Searches[C].CIKM’09:Proceedings of the 18th ACMConference on Information and Knowledge Management.New York,NY,USA:ACM,2009:1625–1628.)。倒排文件是关键字查询评估中最流行和高效的数据结构,一般用于文本信息的索引,能够快速定位某一关键字的位置,但是无法实现对空间信息和关系属性的直接索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司,未经国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910575917.7/2.html,转载请声明来源钻瓜专利网。