[发明专利]云主机异常故障检测恢复系统、方法及云平台有效
申请号: | 201811422877.4 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109522095B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 许广彬;张建峰;谭瑞忠 | 申请(专利权)人: | 无锡华云数据技术服务有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455;G06F11/30 |
代理公司: | 苏州友佳知识产权代理事务所(普通合伙) 32351 | 代理人: | 储振 |
地址: | 214000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主机 异常 故障 检测 恢复 系统 方法 平台 | ||
1.云主机异常故障检测恢复系统,其特征在于,包括:采集组件(30),整理组件(40)、内置动作库(501)的数据库(50)、学习组件(60)、交互组件(70)、执行组件(80)及监控组件(90);
采集组件(30)采集状态数据,使用整理组件(40)进行归类标记以形成故障检测用例集与正常用例集;
学习组件(60)提取故障检测用例集,训练得到最佳故障检测模型并发送至数据库(50);
交互组件(70)调用执行组件(80)以执行动作库(501)中的动作,通知并使用整理组件(40)进行归类标记以形成故障恢复用例集;
监控组件(90)自数据库(50)获取最佳故障检测模型,并与整理组件(40)实时采集的状态数据进行对比,在对比成功后,调用故障检测用例集中的实例,以对云主机进行故障标定。
2.根据权利要求1所述的云主机异常故障检测恢复系统,其特征在于,所述采集组件(30)部署于控制节点(10)或者计算节点(20)中;
所述数据库(50)、学习组件(60)、交互组件(70)、执行组件(80)及监控组件(90)仅部署于控制节点(10)中。
3.根据权利要求1所述的云主机异常故障检测恢复系统,其特征在于,所述状态数据由系统基础数据、系统服务日志及API返回结果共同描述;
所述系统基础数据由CPU资源占用率、内存占用率、网卡流量中的至少一种构成;
所述API返回结果由具体的云主机与计算节点(20)中其他的云主机之间或者控制节点(10)之间所形成的数据;
所述系统服务日志为“/var/log/”目录中的日志文件。
4.根据权利要求3所述的云主机异常故障检测恢复系统,其特征在于,所述使用整理组件(40)进行归类标记以形成故障检测用例集与正常用例集具体为:
整理组件(40)在设定时间段内的系统基础数据及系统服务日志进行转换标签处理,以形成第一类标签;
将相同的设定时间段内的API返回结果进行转换标签处理,当API返回结果符合故障类型时转换为第一类特征码,当API返回结果符合非故障类型时转换为第二类特征码;
将设定时间段与第一类标签及第一类特征码进行关联,以形成故障检测用例集中的一个用例,将设定时间段与第一类标签及第二类特征码进行关联,以形成正常用例集中的一个用例。
5.根据权利要求3所述的云主机异常故障检测恢复系统,其特征在于,所述学习组件(60)训练得到最佳故障检测模型具体为:
所述学习组件(60)提取故障检测用例集并按照设定比例将故障检测用例集中的用例划分为故障检测训练集、故障检测验证集与故障检测测试集,并基于机器学习算法训练得到最佳故障检测模型;
其中,故障检测训练集、故障检测验证集与故障检测测试集的划分比例为:8:1:1。
6.根据权利要求5所述的云主机异常故障检测恢复系统,其特征在于,所述机器学习算法为决策树算法、朴素贝叶斯算法、最小二乘法、支持向量机算法、聚类算法、主成分分析法或者独立成分分析法。
7.根据权利要求1所述的云主机异常故障检测恢复系统,其特征在于,所述交互组件(70)接收自定义故障输入,以对数据库(50)中留存的最佳故障检测模型进行更新;其中,所述最佳故障检测模型的数量仅为一个。
8.根据权利要求1所述的云主机异常故障检测恢复系统,其特征在于,所述故障检测用例集、正常用例集及故障恢复用例集均保存于数据库(50)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡华云数据技术服务有限公司,未经无锡华云数据技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811422877.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软件演示方法、系统和计算机设备
- 下一篇:信息处理方法及其装置