[发明专利]倒排Voronoi索引在审
申请号: | 201711358210.8 | 申请日: | 2017-10-19 |
公开(公告)号: | CN108021690A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | 季长清;刘艳;汪祖民;刘飞;刘畅;吴锐 | 申请(专利权)人: | 大连大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 毕进 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | voronoi 索引 | ||
本分案申请涉及一种倒排Voronoi索引,包含两个部分:主索引,其包括所有的聚类中心;第二索引,其包括储存在每个VC的对像队列;效果是:能够提高算法索引效率,索引不受到空间和时间影响。
本申请为申请号2017109759726、申请日2017-10-19、发明名称“基于倒排泰森多边形索引的移动医疗查询方法及应用”的分案申请。
技术领域
本发明属于云计算、大数据领域,涉及一种在分布式环境下可以有效提高查询效率的MapReduce索引。
背景技术
MapReduce是一种目前流行的基于云平台的编程框架,它可以处理及生成大型数据集,其利用无共享集群来支持数据密集型的应用。处理步骤具体为:在分布式缓存系统中,由MapReduce任务在处理一个键/值对时,是在map函数中生成一组中间键/值对,根据相同的中间键来合并所有的中间值,每个map都独立于其他操作,即所有maps就可以并行执行。MapReduce的一组“reducers”可以执行归约操作,具有相同key的Map操作的输出同时可以归约到同一个reducer。然而单独运行一个归约过程可能会使得效率低下;
MapReduce可用于支持比传统的商业服务器集群更大规模的数据处理,它可以在仅仅几小时内即可处理一个PB数量的数据,使用MapReduce进行数据索引具有较好的应用前景。然而,现有的索引算法由于不能适应MapReduce的并行处理,构建索引的时间耗费不够理想,可扩展性不佳。
发明内容
为了提高现有数据查询方法索引效率,并将其应用于移动医疗领域,本发明提供如下方案:
一种基于倒排泰森多边形索引的移动医疗查询方法,手持设备医疗资源需求客户端接入移动互联网,并与医疗资源供给商建立联系,医疗资源需求客户向医疗资源供给商发送医疗资源需求请求,医疗资源需求客户的空间地理信息被采集至用于执行基于MapReduce与倒排泰森多边形的大规模近邻查询方法的系统中,且医疗资源物流车的空间地理信息被所述系统实时采集,所述系统以医疗资源需求客户信息为代表点,以医疗资源位置及医疗资源物流货车位置数据为数据集,将医疗资源的物流车空间地理信息数据集进行分片,使用基于MapReduce与倒排泰森多边形的大规模近邻查询方法以查找到距离医疗资源需求客户均为最近邻的医疗资源物流车位置及医疗资源位置;
所述基于MapReduce与倒排泰森多边形的大规模近邻查询方法包括如下步骤:
S1.构造基于MapReduce的倒排Voronoi索引;
S2.使用倒排Voronoi索引对数据集R和S进行分区;
S3.使用基于MapReduce的IVKNN进行分布式kNN查询。
构造基于MapReduce的倒排Voronoi索引的步骤如下:
S1.1.d维空间中给定两个数据集R和S,Hadoop进行分片,部分mappers同时并行运行,在MapReduce任务中,使用默认的reducer,在启动map函数之前,使用预聚类算法得到代表点p,并加载到每个map的主存中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711358210.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:使用基于MapReduce的IVkNN算法进行查询的方法
- 下一篇:显示装置