[发明专利]一种故障演练方法、装置、计算机设备及存储介质在审
申请号: | 202011574272.4 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112631846A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 赵远远 | 申请(专利权)人: | 广州品唯软件有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
地址: | 510220 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 演练 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种故障演练方法、装置、计算机设备及存储介质,该方法包括:接收用户发出的演练请求,根据演练请求生成演练任务,根据演练任务在待演练的目标系统中确定待演练的目标设备,对目标设备执行故障注入操作,利用演练任务对注入故障后的目标设备进行故障演练操作,获取目标设备的故障演练结果,根据故障演练结果生成演练报表,以便后续根据演练报表判断目标系统是否存在潜在故障问题。本发明通过模拟多种类型的故障场景,在异常行为被触发之前识别出系统中脆弱且易出故障的环节,发现潜在的健壮性问题,提高生产环境中系统的容错性和可恢复性。
技术领域
本发明涉及计算机技术领域,特别涉及一种故障演练方法、装置、计算机设备及存储介质。
背景技术
随着计算机服务和软件行业数字化的发展势头日新月异,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在互联网领域。但由于互联网行业等大型网站有着用户多、流量大、高并发、海量数据、服务高可用、安全环境恶劣、易受网络攻击功能多、变更快、频繁发布等特点,因而也对技术提出了更高的要求。
目前在进行系统测试时,只能根据测试预定的场景进行固定测试,然而在复杂的生产环境中,偶发因素较多,需要从多个维度才能发现生产系统的健壮性问题。例如,由于分布式系统包含大量交互、依赖点,可能出错的地方数不胜数,比如硬盘故障、网络不通、流量激增压垮系统等,在生产环境中实际运行分布式系统时,人力并不能完全阻止故障发生。
因此,亟需提出一种新的故障演练方法,以解决上述问题。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种故障演练方法、装置、计算机设备以及存储介质,以克服现有技术中在进行系统测试时,只能根据测试预定的场景进行固定测试,不能在异常行为被触发之前识别出系统中脆弱且易出故障的环节等问题。
为解决上述一个或多个技术问题,本发明采用的技术方案是:
第一方面,提供了一种故障演练方法,该方法包括如下步骤:
接收用户发出的演练请求,根据所述演练请求生成演练任务;
根据所述演练任务在待演练的目标系统中确定待演练的目标设备,对所述目标设备执行故障注入操作;
利用所述演练任务对注入故障后的所述目标设备进行故障演练操作,获取所述目标设备的故障演练结果;
根据所述故障演练结果生成演练报表,以便后续根据所述演练报表判断所述目标系统是否存在潜在故障问题。
进一步的,所述接收用户发出的演练请求,根据所述演练请求生成演练任务包括:
接收用户发出的演练请求,根据所述演练请求确定对应的故障活动类型以及执行演练操作的环境类型;
根据所述故障活动类型从预先配置的多个故障活动中选取对应的故障活动,并根据所述环境类型配置执行环境;
根据所述故障活动以及所述执行环境生成与所述演练请求对应的演练任务。
进一步的,所述方法还包括故障活动的配置过程,包括:
针对每个活动类型创建对应的初始故障活动,对所述初始故障活动进行参数配置,结合预设演练工具生成最终的故障活动。
进一步的,所述根据所述环境类型配置执行环境包括:
根据所述环境类型从预先配置的功能环境列表中匹配出对应的执行环境;
或,根据环境类型实时配置对应的执行环境。
进一步的,所述故障活动类型至少包括网络、JVM、CPU、内存、磁盘、进程中的一种。
进一步的,所述对所述目标设备执行故障注入操作包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州品唯软件有限公司,未经广州品唯软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011574272.4/2.html,转载请声明来源钻瓜专利网。