[发明专利]容器云集群节点异常检测方法及系统在审
申请号: | 202210506971.8 | 申请日: | 2022-05-11 |
公开(公告)号: | CN114942875A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 石光银;蔡卫卫;高传集;孙思清;肖雪 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F9/455 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 潘悦梅 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 容器 云集 节点 异常 检测 方法 系统 | ||
1.一种容器云集群节点异常检测方法,其特征在于包括如下步骤:
在容器云集群的每个节点上部署节点异常检测组件,所述节点异常检测组件用于提供异常检测服务,通过异常检测服务对节点进行异常数据监控;
定义节点异常检测组件的检测内容,所述检测内容包括检测节点系统时间、日志、CPU、内存、磁盘、网络、进程、容器运行时、容器管理器是否异常;
对于容器云集群中每个节点,通过异常检测服务进行异常数据监控,并将检测的异常信息作为异常事件推送至容器云API服务器;
通过容器云事件中心存储所述异常事件;
通过自动化运维模块订阅容器云事件中心中的异常事件,并通过自动化运维模块内置的自动修复逻辑对节点的异常事件进行自动修复。
2.根据权利要求1所述的容器云集群节点异常检测方法,其特征在于通过组件管理模块在容器云集群的每个节点上部署节点异常检测组件,定义节点异常组件的部署资源,并指定节点异常组件部署的节点标签,通过节点标签限定节点异常检测组件和节点的对应关系。
3.根据权利要求1所述的容器云集群节点异常检测方法,其特征在于对于每个节点异常检测组件,预配置有对应的组件配置文件,所述组件配置文件中预配置有所述节点异常检测组件的检测内容。
4.根据权利要求1所述的容器云集群节点异常检测方法,其特征在于事件中心通过容器云的事件源调用容器云API服务器,从容器云API服务器中获取并存储异常事件。
5.根据权利要求1-4任一项所述的容器云集群节点异常检测方法,其特征在于所述节点异常检测组件提供的节点异常检测服务以容器的形式部署在每个节点上;
所述节点异常检测服务以插件形式运行监控内容,所述插件包括:
system-stats插件,所述system-stats插件用于监控cpu、内存、磁盘、网络、主机、系统特性的异常数据;
kmsg插件,所述kmsg插件用于监控内存溢出、任务Hung住、网络设备没有注册、内核空指针异常、EXT4文件系统错误、IO错误、读取内存错误、docker进程Hung住、文件系统只读的异常数据;
journald插件,所述journald插件用于监控进程Crash、dockerd服务异常、Kubelet启动异常、Docker启动异常、Containerd启动异常相关的异常数据;
custom插件,所述custom插件用于自定义异常事件监控,默认支持ntp异常、docker使用异常、kubelet健康检测、docker健康检测、网络设备异常、网络连接不足、kubelet频繁重启、Docker频繁重启、Containerd频繁重启的异常数据监控;
filelog插件,所述filelog插件用于监控监控Docker镜像层异常、内核内存异常、内核进程hung住的异常数据。
6.一种容器云集群节点异常检测系统,其特征在于用于通过如权利要求1-5任一项所述的容器云集群节点异常检测方法对容器云集群进行节点异常检测和修复,所述系统包括:
组件管理模块,所述组件管理模块用于在容器云集群的每个节点上部署节点异常检测组件,所述节点异常检测组件用于提供异常检测服务,通过异常检测服务对节点进行异常数据监控;
检查项配置模块,所述检查项配置模块用于定义节点异常检测组件的检测内容,所述检测内容包括检测节点系统时间、日志、CPU、内存、磁盘、网络、进程、容器运行时、容器管理器是否异常;
节点异常检测组件,容器云集群的每个节点上均配置有节点异常检测组件,对于容器云集群中每个节点,通过节点异常检测组件提供的异常检测服务进行异常数据监控,并将监测的异常信息作为异常事件推送;
容器云API服务器,所述容器云API服务器用于接收异常检测服务推送的异常事件;
容器云事件中心,所述容器云事件中心与所述容器云API服务器交互,用于存储所述异常事件;
自动化运维模块,所述自动化运维模块与所述容器云事件中心交互,用于订阅容器云事件中心中的异常事件,并通过自动化运维模块内置的自动修复逻辑对节点的异常事件进行自动修复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210506971.8/1.html,转载请声明来源钻瓜专利网。