[发明专利]一种故障处理方法、装置、电子设备及存储介质在审
申请号: | 202011564781.9 | 申请日: | 2020-12-25 |
公开(公告)号: | CN114691395A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 朱豪亮 | 申请(专利权)人: | 国信君和(北京)科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 卢万腾;杜欣 |
地址: | 100083 北京市海淀区北四环中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 处理 方法 装置 电子设备 存储 介质 | ||
本发明涉及一种故障处理方法、装置、电子设备及存储介质,所述方法包括:获取所述容器集群中各个的节点的状态信息,所述节点用于根据接收到的服务调度指令执行服务调度操作;根据所述状态信息确定所述容器集群中的故障节点,以及所述故障节点的目标故障信息;根据目标故障信息确定所述故障节点的故障修复策略;控制所述故障节点执行所述故障修复策略对应的故障修复操作。本申请实施例通过对容器集群中各个节点的状态信息进行分析,从而确定故障节点,以及故障节点的故障信息,根据故障信息获取故障修复策略,实现了故障信息的自动处理,提高了故障处理效率,降低了开发人员的工作量。
技术领域
本申请涉及计算机技术领域,尤其涉及一种故障处理方法、装置、电子设备及存储介质。
背景技术
Kubernetes集群的节点组件在故障的时候,Kubernetes集群并没有对故障的节点的组件进行故障上报,修复的能力,只有当节点完全无准备的情况下,才会去重新调度节点上部署的服务.可以说Kubernetes集群提供的修复能力,只能是针对节点上的服务的一种修复,并不会对节点上其他的组件在故障的时候提供修复。所以在节点出现故障的时候,无法进行故障自动上报或自动处理,而是通过运维人员介入,来对节点上部署的服务进行维护,并解决节点出现的故障,但是该方式全程需要工作人员进行监控及后续处理,从而导致故障修复速度慢,无法使节点进行正常的服务调度。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供了一种故障处理方法、装置、电子设备及存储介质。
第一方面,本发明提供了一种故障处理方法,包括:
获取容器集群中各个的节点的状态信息,所述节点用于根据接收到的服务调度指令执行服务调度操作;
根据所述状态信息确定所述容器集群中的故障节点,以及所述故障节点的目标故障信息;
根据预设的配置信息确定所述目标故障信息对应的所述故障节点的目标故障修复策略,其中,所述配置信息中包括多个故障信息与多个故障修复策略的对应关系;
控制所述故障节点执行所述目标故障修复策略对应的故障修复操作。
在本发明的可选实施例中,所述配置信息的所述对应关系中包含的故障修复策略包括:故障上报和/或自动修复。
在本发明的可选实施例中,当所述目标故障修复策略为故障上报时,所述控制所述故障节点执行所述目标故障处理策略对应的故障修复操作,包括:
确定所述故障节点的节点标识,以及所述节点标识对应的目标客户端;
将所述目标故障信息发送至所述目标客户端,由所述目标客户端处理所述故障节点的目标故障信息。
在本发明的可选实施例中,当所述目标故障修复策略为自动修复时,所述控制所述故障节点执行所述目标故障处理策略对应的故障修复操作,包括:
获取故障修复规则,基于所述故障修复规则确定所述目标故障信息对应的目标修复流程,其中,所述故障修复规则中包括多个故障信息与多个修复流程的映射关系;
按照所述目标修复流程控制所述故障节点执行故障修复操作。
在本发明的可选实施例中,在按照所述目标修复流程控制所述故障节点执行故障修复操作之前,所述方法还包括:
确定所述目标故障信息所表示的故障对所述故障节点服务能力的影响程度;
当所述影响程度符合预设影响程度时,控制所述故障节点停止接收服务调度指令。
在本发明的可选实施例中,在按照所述目标修复流程控制所述故障节点执行故障修复操作之前,所述方法还包括:
根据所述目标修复流程确定预期修复时间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信君和(北京)科技有限公司,未经国信君和(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011564781.9/2.html,转载请声明来源钻瓜专利网。