[发明专利]一种对等云平台上构建希尔伯特R树索引的方法有效
申请号: | 201310478326.0 | 申请日: | 2013-10-14 |
公开(公告)号: | CN103617162A | 公开(公告)日: | 2014-03-05 |
发明(设计)人: | 吴家皋;刘杰;邹志强 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 奚幼坚 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对等 平台 构建 希尔伯特 索引 方法 | ||
技术领域
本发明涉及一种对等云平台上构建希尔伯特R树索引的方法,属于空间数据索引和对等云平台的融合技术领域。
背景技术
云计算是一种商业计算模型将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。现在Google公司和开源云计算平台Hadoop等都使用Map-Reduce平行计算模型,该模型为海量数据的处理提供了一个通用、高效的技术框架,从而在地理空间数据查询处理、数据挖掘等领域得到了越来越广泛的应用。
P2P(Peer-to-Peer,对等网)计算是指不同系统之间通过直接交换,实现计算机资源和服务共享、进行信息处理的过程。这里,资源可以是处理器、缓存和磁盘空间等;服务包括信息交换、数据计算等。P2P模式与传统客户/服务器模式的关键区别在于Peer(对等体)与Peer在通信过程中,可以完全摒弃服务器的角色,通过直接通信获得共享资源或服务。
面对空间数据挖掘、空间决策支持、空间多维动态可视化分析与模拟等诸多属于计算密集型和I/O密集型的空间应用,传统GIS的计算和数据处理能力不能很好地满足应用需求。随着网格计算技术在GIS中的应用逐渐成为研究热点,其分布式并行计算模式与系统架构将有助于提高GIS的整体性能和运行效率。因此,分布式并行计算将成为解决传统GIS计算能力不足问题的重要方法。海量空间数据的组织与管理技术是各类复杂空间应用的基础,也是GIS技术的核心问题。其中,空间索引技术是数据组织与管理的重要研究内容。目前,在数据库管理系统及GIS等科研领域,空间索引技术的研究成果非常丰富,应用较为广泛。然而,针对海量空间数据的组织、管理、存取、处理与应用的分布式并行空间索引技术研究成果较少。
ArielCary等提出了在云平台下运用MapReduce并行构建子R树,将子R树合并,形成的R树索引是一个集中式的,这个集中式的R树成为了它的瓶颈。
AnirbanMondal等提出了再对等网络下建立R树索引,其将空间划分为相等的块,每个对等节点维护一个等分的块,由于存储信息的对等节点不一定是连续的,可能破坏地理空间的连续性。
发明内容
本发明所要解决的技术问题是针对上述背景技术的不足,提供了一种在对等云平台上对地理空间数据建立分布式R树索引的方法。
本发明为实现上述发明目的采用如下技术方案:一种对等结构云平台上构建希尔伯特R树索引的方法,其特征是:在P2P云平台中的主节点(Master)组织成对等结构的Chord网络,首先,通过映射方法(Map)读取数据对象,基于其地理位置得到其所处空间的希尔伯特曲线编码;其次,基于这一编码对数据对象进行分区,并将其传给相应的归约方法(Reduce);然后,归约方法对各个分区的数据对象进行希尔伯特R子树的构建;最后,通过安全散列函数(SHA-1)得到希尔伯特R子树根节点编号的散列值,并将其发布到处于Chord环中的主节点(Master)上,构成完整的分布式希尔伯特R树索引;包括如下步骤:
步骤1,假设数据集为D,设o∈D为数据集中的任一数据对象,o.id为数据对象o的标识符,o.p为数据对象o的地理位置坐标;
步骤2,用映射方法(Map)将数据集D中的数据对象读入,映射方法(Map)输入的关键字为o.id,值为o.p,对于输入的数据对象o,根据其地理位置坐标o.p,将该对象映射到阶的希尔伯特空间曲线填充上(希尔伯特曲线的阶数由数据集的大小决定,数据集大小|D|,则并产生相应希尔伯特编码o.hc;
步骤3,基于希尔伯特编码o.hc,调用分区方法f将数据对象o映射到相应的分区,分区方法f的输入为数据对象的希尔伯特编码,输出为分区号,定义如下:
则映射方法(Map)输出的关键字为分区号f(o.hc),值为o,根据分区方法f,数据对象将被映射到个分区中,分区数目由处于Chord环中的主节点(Master)的数目决定,设主节点(Master)是数目为N,则
步骤4,用个归约方法(Reduce)接收映射方法(Map)的输出作为输入,其关键字为分区号f(o.hc),值为o,各个归约方法(Reduce)对于输入的某一分区的数据对象分别进行希尔伯特R子树的构建,并将该分区号作为构建好的希尔伯特R子树根节点的编号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310478326.0/2.html,转载请声明来源钻瓜专利网。