[发明专利]MapReduce参数的动态确定方法及装置有效
申请号: | 201310078507.4 | 申请日: | 2013-03-12 |
公开(公告)号: | CN103218263A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 林学练;于晨晖;韩军;叶玥;崔晓龙 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | mapreduce 参数 动态 确定 方法 装置 | ||
1.一种MapReduce参数的动态确定方法,其特征在于,包括:
获取MapReduce作业请求,所述MapReduce作业请求包括待作业数据集、预设的Reduce任务的数量以及用于表示是否允许启动Reduce任务数量的调整机制的参数;
若所述用于表示是否允许启动Reduce任务数量的调整机制的参数为允许,则监控Map任务的执行;
若已执行的Map任务的数量满足预设的第一阈值,所述已执行的Map任务的输出结果映射到预设的Reduce任务的数量的分区,则确定调整后的Reduce任务的数量;
根据所述调整后的Reduce任务的数量,将各未执行的预设Reduce任务对应到各调整后的Reduce任务,以使执行各调整后的Reduce任务。
2.根据权利要求1所述的方法,其特征在于,所述确定调整后的Reduce任务的数量,具体包括:
根据未执行的Reduce任务的数据总量,确定调整后的Reduce任务的数量。
3.根据权利要求2所述的方法,其特征在于,所述根据未执行的Reduce任务的数据总量,确定调整后的Reduce任务的数量,具体包括:
根据以下公式,确定调整后的Reduce任务的数量:
其中,n为调整后的Reduce任务的数量,TR为执行调整后的一个Reduce任务的时间成本,TRS为执行调整后的所有Reduce任务的总时间成本,TR取决于未执行的Reduce任务的数据总量和调整后的Reduce任务的数量。
4.根据权利要求1所述的方法,其特征在于,所述MapReduce作业请求还包括用于提前调度Reduce任务执行的预设的第二阈值,若所述第二阈值小于所述第一阈值,则所述若已执行的Map任务的数量满足预设的第一阈值之前,还包括:
若所述已执行的Map任务的数量满足所述第二阈值且不满足预设的第一阈值,则监控预设Reduce任务的执行,每个预设Reduce任务分别对应所述预设的Reduce任务的数量的分区中的一个分区;
所述若已执行的Map任务的数量满足预设的第一阈值之后,还包括:
指示停止执行未执行的预设Reduce任务。
5.根据权利要求1~4中任一项所述的方法,其特征在于,所述预设的第一阈值为预设的Map任务的数量阈值或预设的比值,所述若所述已执行的Map任务的数量满足预设的第一阈值,则确定调整后的Reduce任务的数量,具体为:
若所述已执行的Map任务的数量满足所述预设的Map任务的数量阈值,则启动Reduce任务数量的调整机制,确定调整后的Reduce任务的数量;或者,
若所述已执行的Map任务的数量与Map任务的总数量之间的比值满足预设的比值,则启动Reduce任务数量的调整机制,确定调整后的Reduce任务的数量,所述Map任务的总数量根据所述待作业数据集确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310078507.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:玻璃钢木材静电喷粉工艺
- 下一篇:电容式触摸屏生产工艺