[发明专利]一种自监控方法和装置在审
申请号: | 201811431534.4 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109474470A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 刘元松 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 林桐苒;解婷婷 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法和装置 初步分析 监控服务 自监控 预设 定时轮询 方式获取 实时状态 系统日志 异常恢复 异常原因 状态异常 检索 | ||
本发明公开了一种自监控方法和装置,该方法包括:利用定时轮询的方式获取预设的监控服务的实时状态;当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;根据初步分析结果执行不同的异常恢复策略。
技术领域
本申请涉及计算机技术领域,尤其涉及一种自监控方法和装置。
背景技术
在云资源管理平台中,存在着大量的虚拟资源或物理设备。数量众多的资源、设备需要统一纳入到平台的管理中,并且要求云资源管理平台可以对其进行实时监控。因此,监控管理模块是云资源管理平台中用于实现监控管理关键的一部分。在云资源管理平台中,一方面,监控管理模块通常利线程或者定时程序去查询资源、设备的状态,其负荷往往较大;另一方面,监控管理服务模块是云资源管理平台中极其重要的一环,对监控管理模块自身的稳定性与健壮性有较高的要求。然而,云资源管理平台中的监控管理模块往往只关注于对其他模块的监控而忽视对自身服务的监控,或者对自身服务出现的问题缺乏相应的有效的快速处理机制。
发明内容
本申请的主要目的在于提供一种自监控方法和装置,可以针对云资源管理平台的监控管理进行监控,确保监控管理服务在出现问题时可以快速解决问题或快速报警,使故障能够及时地被发现并恢复,大大提高了系统监控服务的可用性。
为了解决上述技术问题,本申请提供了一种自监控方法,包括:
利用定时轮询的方式获取预设的监控服务的实时状态;
当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;
根据初步分析结果执行不同的异常恢复策略。
在一个示例性的实施例中,所述根据初步分析结果执行不同的异常恢复策略包括:
根据初步分析结果确定异常原因是否为已知原因;
当所述异常原因为已知原因时,按照已有的故障解决方案执行异常恢复,记录操作日志;
当所述异常原因为未知原因时,查询所述预设的监控服务对应的数据库数据,将用于初步分析的日志数据与查询到的数据库数据结合进行二次分析,根据二次分析结果尝试异常恢复的方式。
在一个示例性的实施例中,所述根据二次分析结果尝试异常恢复的方式之后,所述方法还包括:
若所述预设的监控服务的状态恢复,则将此次异常的关键信息进行总结得到此次异常的问题描述,将该问题描述以及恢复方式记录到已有的故障解决方案中,并记录操作日志;
若尝试恢复方式的次数等于预设的最大次数时,所述预设的监控服务的状态仍异常,则上报告警。
在另一个示例性的实施例中,所述根据初步分析结果确定异常原因是否为已知原因包括:
将所述初步分析结果与已有的故障解决方案中的异常问题进行比对,若已有的问题解决方案中存在与所述初步分析结果相同的异常问题,则确定该异常原因为已知原因。
在另一个示例性的实施例中,所述预设的监控服务包括监控管理服务中的关键服务。
为了解决上述问题,本申请还提供了一种自监控装置,包括:存储器和处理器;其中:
所述存储器,用于存储用于自监控的程序;
所述处理器,用于读取执行所述用于自监控的程序,执行如下操作:
利用定时轮询的方式获取预设的监控服务的实时状态;
当所述预设的监控服务的状态异常时,对系统日志进行检索并初步分析异常原因;
根据初步分析结果执行不同的异常恢复策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811431534.4/2.html,转载请声明来源钻瓜专利网。