[发明专利]应用于电子地图的空间关键字查询的搜索方法在审
申请号: | 201910333874.1 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110069592A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 姚斌;刘音沛;徐阳;过敏意;陈全;李超;沈耀;冷静文;郑文立;林昊 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/9537 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 王函 |
地址: | 200030 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 查询关键字 跳转 布隆过滤器 查询 空间关键字 电子地图 词汇表 搜索 读取 非叶子节点 索引效率 系统资源 叶子节点 初始化 父节点 子节点 比对 索引 映射 子项 应用 指向 节约 | ||
本发明公开了一种应用于电子地图的空间关键字查询的搜索方法,其包括如下步骤:S1:读取待查询关键字的数目,若所述待查询关键字为多关键字则跳转至S2,否则跳转至步骤S7;S2:将待查询关键字的频率与频率阈值进行比对,若待查询关键字的频率为低频则跳转至步骤S7、否则跳转至步骤S3;S3,构建叶子节点u:将各关键字t映射到包含t的对象列表来构建u的倒排列表,并收集u的词汇表构建父节点的布隆过滤器;S4,构建非叶子节点p:将p的各个子项指向的子节点构成节点p的词汇表,并插入初始化布隆过滤器;S5,基于布隆过滤器的IR‑tree的构建;S6,构建IR‑tree的查询索引;S7:对待查询关键字构建R‑tree查询结构。本发明提升其对关键字的索引效率,节约系统资源。
技术领域
本发明属于定位技术领域,具体来说涉及一种应用于Spark平台上的应用于电子地图的空间关键字查询的搜索方法。
背景技术
近年来随着通信技术的发展和移动终端的广泛使用,基于位置的社会服务层出不穷。空间关键字查询是以用户的地理位置信息和多个查询关键字作为参数,返回和这些参数有着空间和文本相关度的空间对象。在一个查询中,构建有效的索引结构,可以极大地提高查询效率。对于一个空间中的索引,是指将对象的位置信息,大小形状等按照一定结构排列的一种数据结构。准确空间关键字查询的最先进的解决方案都是基于空间优先的索引结构,这种方案存在的问题是,一般的空间文本对象都会有至少数十个关键字。而基于空间优先的结构在对平均具有数十个关键字的空间文本对象进行索引优化时非常低效。此外,空间优化结构利用字符串匹配来剪枝无关节点,这在处理出现频率较高的关键字时可能是无意义的,而在这种情况下,我们仍然需要访问许多子节点。因此,如何开发出一种新型的空间关键字查询的搜索方法,能够在空间关键字查询过程中提升其对关键字的索引效率,节约系统资源,是本领域技术人员需要研究的方向。以下为本申请中所涉及的字母缩写的注释:R-tree:B-tree向多维空间发展的另一种形式,它将空间对象按范围划分,每个结点都对应一个区域和一个磁盘页,非叶结点的磁盘页中存储其所有子结点的区域范围,非叶结点的所有子结点的区域都落在它的区域范围之内。IR-tree:以倒排索引和R-tree索引为基础,通过倒排索引解决文本相似度的计算模型。BFIR-tree:基于海量数据处理实现的IR-tree;CBFIR-tree:动态的BFIR-tree;S2I-V结构:对不同频率的关键字应被区别处理的模型结构;eBRQ:基于关键字包含的范围查询;aBRQ:基于近似关键字包含的k最近邻查询;falsepositive:误检率;。KNN算法:即临近算法,是数据挖掘分类技术中最简单的方法之一。I-Node:一个叶子R树节点,它存储了将每个关键字映射到空间关键字对象的倒排列表。
发明内容
本发明要解决的技术问题是提供了一种应用于电子地图的空间关键字查询的搜索方法,能够提升其对关键字的索引效率,节约系统资源。
其采用的技术方案如下:
一种应用于电子地图的空间关键字查询的搜索方法,其包括如下步骤:S1:读取数据集的各条数据进行索引构建、针对单条数据的各个关键字分别跳转至步骤S2;S2:将关键字的频率与频率阈值进行比对,若关键字的频率低于所述频率阈值则跳转至步骤S7、否则跳转至步骤S3;S3,构建叶子节点u:设u中包含的点的集合为up,将各关键字t映射到包含t的对象列表来构建u的倒排列表,并收集u的词汇表构建父节点的布隆过滤器;S4,构建非叶子节点p:设p的子项为{c1,…,cf},所述f为一个节点最大能容纳的子项数目,将p的各个子项指向的子节点构成节点p的词汇表,并对各关键字插入初始化的布隆过滤器;S5,构建根节点、完成基于布隆过滤器的IR-tree的构建;S6,构建基于布隆过滤器的IR-Tree结构的查询索引;S7:对待查询关键字构建R-tree数据查询结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910333874.1/2.html,转载请声明来源钻瓜专利网。