[发明专利]一种基于虚拟机动态迁移的高性能MapReduce实现方法有效

申请号：	201410238408.2	申请日：	2014-05-30
公开（公告）号：	CN104008012B	公开（公告）日：	2017-10-20
发明（设计）人：	唐卓;江林刚;曾优;杨黎;马稳;祁玲	申请（专利权）人：	长沙麓云信息科技有限公司
主分类号：	G06F9/48	分类号：	G06F9/48;G06F9/455
代理公司：	长沙市融智专利事务所43114	代理人：	黄美成
地址：	410082 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于虚拟机动态迁移的高性能MapReduce实现方法，通过应用CloudStack的虚拟机云管理平台实时监控集群状态，对split数据分块进行抽样，统计Reduce任务所在虚拟机上接收到的每一个key值对应的Map任务源，获得生成key值最多的Map任务源；以获得的Map任务源所在虚拟机的物理机器作为对应Reduce任务所在虚拟机的迁移目标；为核心，通过虚拟机动态迁移实现Reduce任务尽可能本地化地接收相同key值的Map任务的输出，节约网络带宽。
搜索关键词：	一种基于虚拟机动态迁移性能 mapreduce 实现机制
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于虚拟机动态迁移的高性能MapReduce实现方法，其特征在于，包括以下步骤：步骤1：在物理服务器上构建具有虚拟机的分布式运行Hadoop系统；步骤2：用户Client向步骤1所述Hadoop系统提交作业，Hadoop系统将作业分解为split数据分块；步骤3：从split数据分块中依据规则抽取样本元素，然后将所有抽取的样本元素作为模拟样本组；步骤4：由Map任务对模拟样本组进行处理，得到每个split数据分块所对应生成的键值对<key，value>，并按照key值对数据进行分区，从而产生分区partition；步骤5：每一个partition由一个Reduce任务进行处理，依次统计Reduce任务所在虚拟机上接收到的每一个key值对应的Map任务源，获得生成key值最多的Map任务源；步骤6：以步骤5获得的Map任务源所在虚拟机的物理机器作为对应Reduce任务所在虚拟机的迁移目标；步骤7：对其他Reduce任务重复步骤5和步骤6，获得整个Hadoop系统内所有虚拟机的迁移路径的集合对应虚拟机迁移网络拓扑图；所述步骤1中虚拟机的构建采用CloudStack虚拟机云管理平台安装在物理服务器集群上创建多个独立的虚拟机，所有虚拟机由CloudStack虚拟机云管理平台管控和监测，每个虚拟机以单独的操作系统运行Hadoop MapReduce任务。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于长沙麓云信息科技有限公司，未经长沙麓云信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410238408.2/，转载请声明来源钻瓜专利网。

上一篇：苯乙基苯丙酰胺类化合物及其应用
下一篇：宽带指标的采集、监测和展示方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于虚拟机动态迁移的高性能MapReduce实现方法有效

专利文献下载