[发明专利]工作负载集群的修复方法、装置、设备及可读存储介质在审
申请号: | 202111274663.9 | 申请日: | 2021-10-29 |
公开(公告)号: | CN114020509A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 周国伟 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/14 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 沈惠娟 |
地址: | 250000 山东省济南市自由贸易试验区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工作 负载 集群 修复 方法 装置 设备 可读 存储 介质 | ||
本发明涉及计算机技术领域,公开了一种工作负载集群的修复方法、装置、设备及可读存储介质。其中,该方法包括:获取工作负载集群对应的备份数据,该备份数据为工作负载集群正常运行的数据;检测工作负载集群的运行状态是否正常;当工作负载集群的运行状态异常时,确定工作负载集群的异常信息;基于备份数据对工作负载集群的异常信息进行异常修复。通过实施本发明,实现了集群的异常自动修复,无需运维人员手工干预,减少了集群异常的运维时间,提高了集群的异常修复效率。
技术领域
本发明涉及计算机技术领域,具体涉及一种工作负载集群的修复方法、装置、设备及可读存储介质。
背景技术
集群在运行过程中,经常遇到各种异常问题,如网络断开、存储不足、内存溢出等问题,从而导致集群状态变为异常(集群正常状态为READY,异常状态为非READY的其他字段),一旦集群异常,容器平台则无法使用集群的资源,无法在集群上进行任何操作,集群的插件管理、应用管理等功能都无法使用,已安装的插件、应用等也无法使用了。其中,容器平台集群指kubernetes(k8s)集群,即通过k8s创建的集群,但容器平台使用的资源是虚拟化平台OpenStack的,即通过OpenStack管理的资源。容器平台通过OpenStack资源创建k8s集群,OpenStack负责管理虚拟机,而k8s负责管理容器,而容器运行在虚拟机中,如图1所示的k8s集群与OpenStack的资源关系图。容器既可以在虚拟机上,也可以在物理机上,但在云计算领域中,由于物理机无法满足高可用和负载均衡等场景,且极其耗费资源,因此通常采用虚拟机来运行容器。通过OpenStack以及k8s组合运行,一方面能够保障虚拟机的运行,解决计算、存储、网络等问题,提供安全的隔离,另一方面能够保障容器的运行环境,解决集群资源调度、资源编排等问题,提供应用的运行。
通常容器平台在集群异常时是能够修复的,如OpenStack被删除等。尽管k8s具有强大的修复能力,但其只针对k8s集群内部的容器,若集群本身异常,则需要进行人工排查修复,然而人工排查效率较低,集群运维时间较长,导致集群修复效率较低。
发明内容
有鉴于此,本发明实施例提供了一种工作负载集群的修复方法、装置、设备及可读存储介质,以解决人工排查效率较低,集群运维时间较长,导致集群修复效率较低的问题。
根据第一方面,本发明实施例提供了一种工作负载集群的修复方法,包括:获取工作负载集群对应的备份数据,所述备份数据为所述工作负载集群正常运行的数据;检测工作负载集群的运行状态是否正常;当所述工作负载集群的运行状态异常时,确定所述工作负载集群的异常信息;基于所述备份数据对所述工作负载集群的异常信息进行异常修复。
本发明实施例提供的工作负载集群的修复方法,通过获取工作负载集群对应的备份数据,其中,该备份数据为工作负载集群处于正常运行状态时备份的数据,当检测到工作负载集群的运行状态异常时,获取工作负载集群的异常信息,并根据正常运行状态备份的数据对工作负载集群的异常信息进行异常修复。该方法在工作负载集群发生异常时自动根据备份数据对集群进行异常处理,实现了集群的异常自动修复,减少了运维人员对集群的手工干预,提高了集群的恢复性,减少了集群异常的运维时间,使得集群能够及时恢复至正常运行状态,提高了集群的异常修复效率,从而保证了集群持续可用,提高了集群可靠性。
结合第一方面,在第一方面的第一实施方式中,所述基于所述备份数据对所述工作负载集群的异常信息进行异常修复,包括:获取所述异常信息对应的异常原因;基于所述异常原因和所述备份数据,对所述工作负载集群进行异常修复。
结合第一方面第一实施方式,在第一方面的第二实施方式中,当所述异常原因为网络异常时,所述基于所述异常原因和所述备份数据,对所述工作负载集群进行异常修复,包括:获取所述工作负载集群的网络修复次数;判断所述网络修复次数是否超过预设次数;当所述网络修复次数超过所述预设次数后仍未修复,根据所述备份数据重新生成所述工作负载集群;基于所述备份数据中的各个配置文件对重新生成的所述工作负载集群进行配置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111274663.9/2.html,转载请声明来源钻瓜专利网。