[发明专利]空间数据搜索结果的聚类和查询的方法及系统有效
申请号: | 201911001474.7 | 申请日: | 2019-10-21 |
公开(公告)号: | CN112765405B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 张华杰 | 申请(专利权)人: | 千寻位置网络有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906;G06F16/903;G06F16/909 |
代理公司: | 上海一平知识产权代理有限公司 31266 | 代理人: | 成春荣;须一平 |
地址: | 200438 上海市杨浦区国权北*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空间 数据 搜索 结果 查询 方法 系统 | ||
本申请公开了一种空间数据搜索结果的聚类和查询方法、系统。该方法包括:获取选定区域范围内目标的位置数据集合;采用聚类算法将所述位置数据集合进行划分,为所述位置数据集合构建树,所述树的每个结点包括距离相近的若干个位置数据或子结点;根据用户输入在所述选定区域范围内建立查询矩形,并指定返回的结点的数量范围;从所述树的根结点开始查询,若当前结点的最小边界矩形与所述查询矩形有重叠,则向该结点的子结点遍历,直至所述查询区域内各层的结点数满足指定的所述数量范围。
技术领域
本说明书一般涉及数据搜索技术领域,具体涉及一种空间数据搜索结果的聚类和查询方法、系统。
背景技术
随着计算机和信息技术的发展,产生了海量的多媒体数据,如何在海量的多媒体数据库中快速找到所需的信息是当前多媒体数据库领域研究的一个重点问题。传统的方法是由人工对多媒体数据进行标注,然后通过文本检索来实现多媒体信息检索。然而人工标注存在工作量大和主观性强的缺陷,对于爆炸式增长的多媒体数据来说,完全人工标注是不可实现的,因此需要研究基于内容的多媒体信息检索技术。
聚类分析是数据挖掘中广为研究的课题之一,是从数据中寻找数据间的相似性,并依此对数据进行分类,从而发现数据中隐含的有用信息或知识。搜索是指给定查询条件,对数据库中满足查询条件的数据进行查找的一种信息检索的关键。现有的技术方案主要过程是这样:先通过位置搜索,过滤得到满足条件的数据,然后对过滤后的数据进行聚类。例如专利文献“动态地理网格聚类算法(CN104021274A)”中描述,将搜索区域划分成大小相同的网格,对同一个网格内的数据进行聚类,然后合并相近网格的聚类。
每次当搜索矩形发生变化,针对返回聚类的颗粒度(对应地图的缩放级别)同时发生变化,落在此矩形范围内的数据发生了改变,导致聚类的结果需要重新计算。当数据量比较大,尤其是当输入的矩形范围比较大的时候,这种方法的效率就会比较低。
发明内容
本说明书提供了一种空间数据搜索结果的聚类和查询方法、系统,提升聚类搜索的效率。
本申请公开了一种空间数据搜索结果的聚类和查询方法,包括:
获取选定区域范围内目标的位置数据集合;
采用聚类算法将所述位置数据集合进行划分,为所述位置数据集合构建树,所述树的每个结点包括距离相近的若干个位置数据或子结点;
根据用户输入在所述选定区域范围内建立查询矩形,并指定返回的结点的数量范围;
从所述树的根结点开始查询,若当前结点的最小边界矩形与所述查询矩形有重叠,则向该结点的子结点遍历,直至所述查询区域内各层的结点数满足指定的所述数量范围。
在一个优选例中,所述结点及其包含的位置数据总和显示于该结点的包含的若干个位置数据或子结点的最小边界矩形的中心位置处。
在一个优选例中,所述树的根结点之外的所有结点的子结点数目范围为m至M,m=M/2;所述树的根结点个数小于m。
在一个优选例中,为所述位置数据集合构建树之后还包括:插入新的位置数据至所述树,其步骤包括:
找出与所述新的位置数据相似度最高的叶子结点;
如果该叶子结点的子结点的个数小于M,则所述新的位置数据直接插入该叶子结点,调整该叶子结点的最小边界矩形,并结束;
如果该叶子结点的子结点的个数等于M,则将该叶子结点分裂成两个叶子结点,并对分裂后的两个叶子节点沿着父结点进行树形调整。
在一个优选例中,如果该叶子结点的子结点的数目等于M,则将该叶子结点分裂为两个叶子结点的步骤包括:
在该叶子结点的所有子结点中选取相互距离最远的两个作为种子,所述两个种子分别代表两个分组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于千寻位置网络有限公司,未经千寻位置网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911001474.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置