[发明专利]MapReduce分布式系统的作业诊断方法及设备有效
申请号: | 201310109756.5 | 申请日: | 2013-03-29 |
公开(公告)号: | CN104077328B | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 杨斐;刘旭 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | mapreduce 分布式 系统 作业 诊断 方法 设备 | ||
1.一种MapReduce分布式系统的作业诊断方法,其特征在于,包括:
获得MapReduce分布式系统中待诊断对象的对象标识,所述对象标识包括集群标识,或者集群标识和作业标识;
利用所述对象标识,获得至少一个作业运行的日志文件;
根据所述日志文件和预先配置的诊断规则,对所述至少一个作业进行诊断,以获得诊断结果;
所述根据所述日志文件和预先配置的诊断规则,对所述至少一个作业进行诊断,包括:
根据所述日志文件,提取作业信息;
根据预先设置的数据格式,对所述作业信息进行封装;
根据所述诊断规则,对封装之后的作业信息进行诊断。
2.根据权利要求1所述的方法,其特征在于,所述利用所述对象标识,获得至少一个作业运行的日志文件,包括:
利用所述对象标识,获得所述日志文件的URL;
根据所述日志文件的URL,获得所述日志文件。
3.根据权利要求1~2任一权利要求所述的方法,其特征在于,所述根据所述日志文件和预先配置的诊断规则,对所述至少一个作业进行诊断,以获得诊断结果之后,还包括:
根据所述诊断结果,调整所述至少一个作业的运行控制参数。
4.根据权利要求1~2任一权利要求所述的方法,其特征在于,所述日志文件包括配置文件和状态文件。
5.根据权利要求1~2任一权利要求所述的方法,其特征在于,所述方法还包括:
对所述至少一个作业的运行状况进行统计,以获得统计信息。
6.一种MapReduce分布式系统的作业诊断设备,其特征在于,包括:
获得单元,用于获得MapReduce分布式系统中待诊断对象的对象标识,所述对象标识包括集群标识,或者集群标识和作业标识;
所述获得单元,还用于利用所述对象标识,获得至少一个作业运行的日志文件;
诊断单元,用于根据所述日志文件和预先配置的诊断规则,对所述至少一个作业进行诊断,以获得诊断结果;
所述诊断单元,具体用于
根据所述日志文件,提取作业信息;根据预先设置的数据格式,对所述作业信息进行封装;以及根据所述诊断规则,对封装之后的作业信息进行诊断。
7.根据权利要求6所述的设备,其特征在于,所述获得单元,具体用于
利用所述对象标识,获得所述日志文件的URL;以及根据所述日志文件的URL,获得所述日志文件。
8.根据权利要求6~7任一权利要求所述的设备,其特征在于,所述设备还包括调整单元,用于
根据所述诊断结果,调整所述至少一个作业的运行控制参数。
9.根据权利要求6~7任一权利要求所述的设备,其特征在于,所述获得单元所获得的所述日志文件包括配置文件和状态文件。
10.根据权利要求6~7任一权利要求所述的设备,其特征在于,所述设备还包括统计单元,用于
对所述至少一个作业的运行状况进行统计,以获得统计信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310109756.5/1.html,转载请声明来源钻瓜专利网。