[发明专利]一种分布式hadoop集群故障自动诊断修复系统有效
申请号: | 201510650975.3 | 申请日: | 2015-10-10 |
公开(公告)号: | CN105337765B | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 程永新;胡永;李京龙 | 申请(专利权)人: | 上海新炬网络信息技术股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 袁亚军;金碎平 |
地址: | 201707 上海市青浦区外青*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 hadoop 集群 故障 自动 诊断 修复 系统 | ||
本发明公开了一种分布式hadoop集群故障自动诊断修复系统,包括集群文件系统监控模块:采集获取集群节点信息以及数据库文件;作业任务监控模块:采集作业和任务的信息;物理节点监控模块:监控每个物理节点的资源消耗信息;数据存储分析处理模块:将监控数据存储到数据库;设定监控告警规则,预先配置告警ID、级别及原因;自动修复模块:预先定义配置各类常见告警故障,并为每个告警故障定制预处理脚本,当监控巡检到故障发生时,对当前发生的故障与预先定义配置的告警故障进行匹配,并调用相应的预处理脚本完成故障的自动处理。本发明能够自动诊断修复系统故障,使维护变得更加简单,性能数据、节点状态更加清晰明确。
技术领域
本发明涉及一种集群故障自动诊断修复系统,尤其涉及一种分布式hadoop集群故障自动诊断修复系统。
背景技术
业界没有对hadoop集群监控发现问题后自动分析解决的方案,目前关于hadoop集群故障解决方法为预先配置好关键的运维监控指标,对hadoop集群及相关项目健康进行检查,同时对作业和任务执行进行分析,将监控信息暴露出来,维护人员登录web平台查看存在问题的节点及性能,并登录节点分析日志,修复集群。
现有技术的主要缺点如下:1、不能实现故障实时告警,配置好的每个监控指标需要维护人员登录到web平台查看有问题的节点;2、集群监控只能查看当前的监控数据,没有存储和历史查询功能,无法进行监控数据分析和建立预测模型;3、不能对监控数据进行自动分析及根据分析结果进行自动化修复,需要人工登录到问题节点分析错误日志,根据经验进行故障解决。
发明内容
本发明所要解决的技术问题是提供一种分布式hadoop集群故障自动诊断修复系统,能够轻松有效地控制hadoop集群,使维护变得更加简单,性能数据、节点状态更加清晰明确,分析、发现、解决问题更加快速。
本发明为解决上述技术问题而采用的技术方案是提供一种分布式hadoop集群故障自动诊断修复系统,包括:
集群文件系统监控模块:采集获取集群节点信息以及数据库文件;
作业任务监控模块:采集作业和任务的信息,并对作业任务进行控制管理,包括作业的开启和停止,对指定作业进行周期采样,以及对任务优先级进行管理;
物理节点监控模块:监控每个物理节点的资源消耗信息;
数据存储分析处理模块:对来自所述集群文件系统监控模块、作业任务监控模块和物理节点监控模块的监控数据进行结构化、统一化后存储到数据库;设定监控告警规则,预先配置告警ID、级别及原因;
自动修复模块:预先定义配置各类常见告警故障,并为每个告警故障定制预处理脚本,当所述数据存储分析处理模块监控巡检到故障发生时,对当前发生的故障与预先定义配置的告警故障进行匹配,并调用相应的预处理脚本完成故障的自动处理。
上述的分布式hadoop集群故障自动诊断修复系统,其中,所述集群文件系统监控模块包括:浏览文件记录,namenode日志记录,namenode运行情况、集群配置容量、DFS占用容量、非DFS占用容量、DFS的可使用容量、DFS已使用百分比、DFS可使用百分比、活节点数、死节点数、namenode的存储目录及类型状态。
上述的分布式hadoop集群故障自动诊断修复系统,其中,所述集群文件系统监控模块包括:获取HDFS的实时数据和历史状态,根据HDFS信息浏览和定位相关文件,以及监控关闭或者打开所述相关文件时,各个磁盘已经使用和各个磁盘的总容量,剩余容量,文件名称和数目,以及文件的使用情况和历程。
上述的分布式hadoop集群故障自动诊断修复系统,其中,所述作业任务监控模块控制集群任务概要信息,堆的大小,所占的比例,Map任务数,Reduce任务数以及各个节点上的任务数量值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海新炬网络信息技术股份有限公司,未经上海新炬网络信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510650975.3/2.html,转载请声明来源钻瓜专利网。