[发明专利]云主机异常故障检测恢复系统、方法及云平台有效
申请号: | 201811422877.4 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109522095B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 许广彬;张建峰;谭瑞忠 | 申请(专利权)人: | 无锡华云数据技术服务有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455;G06F11/30 |
代理公司: | 苏州友佳知识产权代理事务所(普通合伙) 32351 | 代理人: | 储振 |
地址: | 214000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主机 异常 故障 检测 恢复 系统 方法 平台 | ||
本发明公开了云主机异常故障检测恢复系统,包括采集组件,整理组件、内置动作库的数据库、学习组件、交互组件、执行组件及监控组件;采集组件采集状态数据,使用整理组件进行归类标记以形成故障检测用例集与正常用例集;学习组件提取故障检测用例集,训练得到最佳故障检测模型并发送至数据库;交互组件调用执行组件以执行动作库中的动作,通知并使用整理组件进行归类标记以形成故障恢复用例集;监控组件自数据库获取最佳故障检测模型,并与整理组件实时采集的状态数据进行对比,在对比成功后,调用故障检测用例集中的实例,以对云主机进行故障标定。本发明所揭示的云主机异常故障检测恢复系统实现了云主机故障的准确判断及故障恢复。
技术领域
本发明涉及云计算技术领域,尤其涉及一种云主机异常故障检测恢复系统以及基于该云主机异常故障检测恢复系统的一种云主机异常故障检测恢复方法,以及一种云平台。
背景技术
在基于IaaS平台的云主机场景中,当云主机(其本质上是一种虚拟机)处于超载或者资源紧张时会被物理机的安全机制强制关闭,从而影响到云主机向用户提供正常的响应及服务。通常的,如果云主机被强制关闭所导致的云主机内部操作系统的蓝屏现象及宕机现象是无法被用户所感知的。既使管理员远程登录后台并发现某个或者某些云主机出现故障时,则实际上出现故障的云主机向用户提供响应及服务的状态已经持续了相当长的一段时间了。
为了监控云主机的状态,通常的解决方案是定时地向云主机的内部注入监控程序,以确定云主机是否存活;并在发现云主机不可访问时判定其为故障云主机,并执行重启操作。但是该现有技术只能检测出云主机不可访问,无法判断这种不可访问是因为“超载或者资源紧张”还是因为基于用户的关机行为所导致的。因此如果采用现有技术手段,会导致对云主机执行重启操作的盲目性,并增加了误判几率。
有鉴于此,有必要对现有技术中的云主机发生故障时的检测恢复系统予以改进,以解决上述问题。
发明内容
本发明的目的在公开一种云主机异常故障检测系统、方法及云平台,以实现不仅仅能够检测到云主机是否发生故障,并判断出该故障是否为基于用户操作意愿所呈现的故障,有效防止对云主机所采取不必要或者错误的干预,提高用户体验;同时,实现云主机能够提供更高可用的业务服务支持,尽量减小云主机的操作系统和物理资源脱节对客户业务连续性的影响。
为实现上述第一个发明目的,本发明公开了一种云主机异常故障检测恢复系统,包括:采集组件,整理组件、内置动作库的数据库、学习组件、交互组件、执行组件及监控组件;
采集组件采集状态数据,使用整理组件进行归类标记以形成故障检测用例集与正常用例集;
学习组件提取故障检测用例集,训练得到最佳故障检测模型并发送至数据库;
交互组件调用执行组件以执行动作库中的动作,通知并使用整理组件进行归类标记以形成故障恢复用例集;
监控组件自数据库获取最佳故障检测模型,并与整理组件实时采集的状态数据进行对比,在对比成功后,调用故障检测用例集中的实例,以对云主机进行故障标定。
作为本发明的进一步改进,所述采集组件部署于控制节点或者计算节点中;
所述数据库、学习组件、交互组件、执行组件及监控组件仅部署于控制节点中。
作为本发明的进一步改进,所述状态数据由系统基础数据、系统服务日志及API返回结果共同描述;
所述系统基础数据由CPU资源占用率、内存占用率、网卡流量中的至少一种构成;
所述API返回结果由具体的云主机与计算节点中其他的云主机之间或者控制节点之间所形成的数据;
所述系统服务日志为“/var/log/”目录中的日志文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡华云数据技术服务有限公司,未经无锡华云数据技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811422877.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软件演示方法、系统和计算机设备
- 下一篇:信息处理方法及其装置