[发明专利]基于Voronoi图的分布式时空索引方法在审
申请号: | 201710976133.6 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107766495A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 季长清;汪祖民;刘艳;高杨;李泽宇 | 申请(专利权)人: | 大连大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 大连智高专利事务所(特殊普通合伙)21235 | 代理人: | 毕进 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于Voronoi图的分布式时空索引方法,属于数据索引领域,用于解决提高现有数据查询方法索引效率的问题,技术要点是分别计算数据集R中的每一个对象r,数据集S中的每一个对象s对象与代表点p点之间的距离,并将对象r,s分配给最接近的代表点P;R中具有m个对象r,一个对象r与任意对象s的最接近的代表点都被聚集在一个Voronoi单元格中,由此产成m个Voronoi单元格作为分区,输出<VCm,List(Pi)>对;效果是大大降低了空间成本,使得空间效率十分高。 | ||
搜索关键词: | 基于 voronoi 分布式 时空 索引 方法 | ||
【主权项】:
一种基于Voronoi图的分布式时空索引方法,其特征步骤如下:使用Spark构建造倒排Voronoi索引,给定d维空间中两个数据集R和S,Spark按默认机制进行分片,部分mappers同时并行运行,在Spark任务中使用默认的reducer,在启动map函数之前,使用预聚类算法得到代表点p,并将其加载到每个map的主存中;在每一个map处理进程中,依次利用TextInputFormat来读取输入的分片,TextInputFormat从文件读取数据到Mapper的实例中,分别计算数据集R中的每一个对象r,数据集S中的每一个对象s对象与代表点p点之间的距离,并将对象r,s分配给最接近的代表点P;R中具有m个对象r,一个对象r与任意对象s的最接近的代表点都被聚集在一个Voronoi单元格中,由此产成m个Voronoi单元格作为分区,输出<VCm,List(Pi)>对,给定查询点p,判别其最邻近的分区或最一些邻近的分区集,mapper输出原始数据集中的到最邻近的分区或最邻近的分区集的每一个对象r、s及其分区VCm的id;将mapper输出到Spark的文件系统。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710976133.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种冬笋红苕粉条及其加工生产方法
- 下一篇:方便粉丝生产系统