[发明专利]一种IT运维管理系统在审
申请号: | 201711047443.6 | 申请日: | 2017-10-31 |
公开(公告)号: | CN107862393A | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 姚小艳 | 申请(专利权)人: | 广西宜州市联森网络科技有限公司 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06F11/07 |
代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 林鹏 |
地址: | 546399 广西壮族自治区河*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 it 管理 系统 | ||
技术领域
本发明涉及系统运维管理技术领域,尤其是一种IT运维管理系统。
背景技术
目前IT运维系统规模不断增长,系统在对服务器、虚拟机、交换机等网络设备性能及其网络连通性进行监测过程中,运维人员每天会收到越来越多的监控报警,面对海量的运维指标当系统出现故障时,运维人员很难从海量监控指标中迅速找到故障根因,报警风暴极大地降低了定位问题的速度,故障恢复速度基本依赖于运维人员的经验以及操作响应速度。因此建立一个故障自动诊断与快速恢复系统协同处理的智能运维平台,针对多场景构建机器学习模型与大数据专家系统,实时对运维平台的异常进行在线诊断与定位,当系统出现故障时通过执行相应策略实现快速修复,恢复正常运行是人们所需要的。
发明内容
为了克服上述问题,本发明提供一种IT运维管理系统,实时对系统的异常进行在线诊断与定位,当系统出现故障时通过执行相应策略实现快速修复,并且能自动对修复结果不理想及修复时间过长的故障提醒系统管理员进行优化。
本发明解决其技术问题所采用的技术方案是:
一种IT运维管理系统,包括系统监测模块、故障信息识别模块、故障修复模块、故障修复评估模块,故障实例数据库、通信模块、脚本调用模块和算法调用模块;
所述系统监测模块用于监测系统的运行状态,当监测到异常时,系统监测模块将当前的状态参数及监测到的异常情况传递给故障信息收集模块;所述系统监测模块还用于采集原始日志数据并将其进行初步整理、格式化
所述故障信息识别模块用于将收集模块传递收集到的异常情况进行识别确认是否为虚警,将判断为故障的信息传递给故障修复模块进行修复;
所述故障修复模块用于在接收到故障信息识别模块的报警信息后根据故障特征对故障进行修复;
所述故障修复评估模块用于对故障修复模块的故障修复结果进行评估是否合格;所述故障修复评估模块还包括时间检测单元和故障处理记录单元,所述时间检测单元用于检测故障修复花费时间并判断所花费的时间是否大于阈值,所述故障处理记录单元用于记录处理的故障的故障原因、消除故障的异常记录、处理时间及评估结果;
所述故障实例数据库用于存储系统的历史故障实例与故障特征;
所述脚本调用模块用于存放及执行各类故障的维护脚本;
所述算法调用模块用于存储并执行各类分类算法、识别算法、匹配算法,供各模块进行调用计算;
所述通信模块用于将故障修复结果评估不合格的故障信息传输给管理人员。
进一步的,所述故障修复评估模块还用于对故障修复后,根据系统的运行状态对每次修复结果进行打分,定期将打分低的自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
进一步的,所述时间检测单元工作流程为:当故障修复模块在接收到故障信息识别模块的报警信息后,所述时间检测单元检测并记录当前系统时间,当故障修复模块将故障修复后,所述时间时间检测单元再次检测并记录当前系统时间,并计算两次所检测到的时间间隔,并判断所述时间间隔是否大于阈值,当所述时间间隔大于阈值时,将该故障自修复执行过程提交给系统管理员进行分析,并提示管理员优化存诸在脚本调用模块中对应的脚本。
进一步的,所述阈值为修复该故障所需平均时间的2-3倍。
进一步的,所述报警信息识别模块接收到报警信息后,提取报警信息的特征与故障实例数据库的故障特征进行初步匹配并计算评分,当评分高于预设阈值时,则认为此为故障信息;当评分低于预设阈值时,提取脚本调用模块中的功能验证脚本执行,对业务进行持续一段时间的验证与观察如持续一段时间内,如业务与功能都正常,则认为此报警为虚警,同时,系统将此种情况存及其特征数据提交至故障实例数据库。
进一步的,所述故障修复模块对故障修复过程为:在接收到报警信息后,将接收到的故障信息与故障实例数据库的各类故障特证进行一一比对,选取若干个相似度最高的故障信息,从故障实例数据库中拉取对应的主动诊断脚本的编号,再到脚本调用模块中调用主动诊断脚本,来进一步获取诊断日志,获取到诊断日志后,与故障实例数据库的中的实例特证进行一一比对,计算契合度;当有多个契合度达标,则首先采用契合度高的方案调用执行对应的修复脚本,进行修复,修复完成后,再调用故障修复评估模块进行评估,评估达标则修复完成;如果评估不达标,则进行回退,再执行下一个契合度达标的方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西宜州市联森网络科技有限公司,未经广西宜州市联森网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711047443.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理