[发明专利]一种子系统故障监测装置及方法在审
申请号: | 201910628574.6 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110266549A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 赵秋红;丁国茂;郑烽华;周冬冬 | 申请(专利权)人: | 上海纳宇电气有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 张德宝 |
地址: | 201801 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 缓存模块 心跳组件 运行参数 故障信息 故障监测装置 故障诊断算法 获取子系统 子系统故障 监测装置 降低系统 占用资源 种子系统 健康 发送 | ||
1.一种子系统故障监测装置,其特征在于,所述装置包括:
健康心跳组件,用于获取子系统的运行参数;
缓存模块,与所述健康心跳组件连接,用于接收所述健康心跳组件发送的所述子系统的运行参数;
哨兵模块,与所述缓存模块连接,用于获取所述缓存模块的故障信息,和从所述缓存模块获取所述子系统的运行参数,并通过故障诊断算法获取所述子系统的故障信息。
2.根据权利要求1所述的装置,其特征在于,所述健康心跳组件在子系统中运行,按照第一预定时间间隔向所述缓存模块发送子系统的运行参数。
3.根据权利要求1所述的装置,其特征在于,所述故障诊断算法通过计算堆内存的占比、子系统宕机时间、老年代内存分配占比、Full GC耗时上限时间和CPU使用率来判断所述子系统的故障。
4.根据权利要求1所述的装置,其特征在于,所述缓存模块为根据关键字取值分布式存储系统。
5.根据权利要求1所述的装置,其特征在于,所述哨兵模块包括:
缓存模块监控单元,用于根据所述缓存模块的参数信息向所述缓存模块写入监控心跳信息,在写入失败的情况下,控制缓存模块重启;
子系统监控单元,用于从所述缓存模块获取所述子系统的运行参数,并通过故障诊断算法获取所述子系统的故障信息,并根据所述子系统的故障信息控制所述子系统重启。
6.根据权利要求5所述的装置,其特征在于,所述哨兵模块中存储了子系统重启脚本文件的全路径、缓存模块重启脚本文件的全路径和访问缓存模块的相关参数。
7.一种子系统故障监测方法,其特征在于,所述方法包括:
子系统定时向缓存模块发送运行参数;
缓存模块对所述运行参数进行缓存;
哨兵模块从所述缓存模块获取所述子系统的运行参数;
根据所述运行参数,通过故障诊断算法获取所述子系统的故障信息;
根据所述子系统的故障信息控制所述子系统重启。
8.根据权利要求7所述的方法,其特征在于,在哨兵模块从所述缓存模块获取所述子系统的运行参数之前,包括:
哨兵模块根据所述缓存模块的参数信息向所述缓存模块写入监控心跳信息;
判断所述监控心跳信息是否成功写入;
若写入失败,则控制缓存模块重启。
9.根据权利要求8所述的方法,其特征在于,所述成功写入包括:一次性成功写入;
或按照预设失败重试次数和预设失败重试间隔时间尝试多次成功写入。
10.根据权利要求7所述的方法,其特征在于,所述故障诊断算法通过计算堆内存的占比、子系统宕机时间、老年代内存分配占比、Full GC耗时上限时间和CPU使用率来判断所述子系统的故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海纳宇电气有限公司,未经上海纳宇电气有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910628574.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通信组网仿真检测系统
- 下一篇:故障影响预测的方法及装置