[发明专利]云计算集群服务器状态监控系统和方法在审
申请号: | 201310372875.X | 申请日: | 2013-08-23 |
公开(公告)号: | CN103475696A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 康暖 | 申请(专利权)人: | 汉柏科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/26;H04L12/24 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 陆军 |
地址: | 300384 天津市西青*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 集群 服务器 状态 监控 系统 方法 | ||
技术领域
本发明涉及云计算集群服务器技术领域,具体涉及一种云计算集群服务器状态监控系统和方法。
背景技术
云计算是一种全新的计算模式,其核心思想是企业或个人不再需要在电脑中安装大量应用软件,而是通过Web浏览器接入到一种大范围的、按需定制的服务中,即“云服务”。云计算技术将使用户体验发生根本性的变化。相比传统服务器架构,云计算服务器大大提高了其利用率,同时也在系统中省去了很多重复的硬件,将计算、存储、交换、管理等集成到标准系统中,并且与外界的网络设备、存储设备间的接口和通用架构保待一致。
集群服务器,简而言之,就是一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。一组集群服务器包含多台拥有共享数据存储空间的服务器,各服务器之间通过内部局域网进行相互通信;当其中一台服务器发生故障时,它所运行的应用程序将由其他的服务器自动接管;在大多数情况下,集群中所有的计算机都拥有一个共同的名称,集群系统内任意一台服务器都可被所有的网络用户所使用。
在云计算集群服务器系统中,由多个服务器组成的集群服务器做用户负载和服务器备份,用户登录服务器时,会根据云计算服务器负载到指定服务器上处理用户数据。其中服务器之间都有至少一个备份服务器,对大规模集群方式的云计算服务器组来说,感知其中一台服务器设备的指定业务模块异常非常重要,其中云计算服务器通常由网页处理模块,用户交互管理模块,用户数据存储模块组成,当其中一个业务模块出现异常时,其他模块无法感知。
现有技术存在的问题:
现有技术是服务器设备异常后,等待管理员重启;服务器设备异常后,等待服务器设备进程异常调度超时,服务器设备重启。
因此,急需提出一种云计算集群服务器状态监控系统和方法,帮助我们解决上述的问题。
发明内容
本发明的一种云计算集群服务器状态监控系统和方法,使用一个感知服务器,能够快速感知服务器设备异常,快速做出服务器设备异常判断并快速通过判断提供正确的处理方式恢复服务器设备工作,当一个服务器出现一个模块异常时,由第三方监控设备对其进行感知,评估异常风险并做出相应动作,保证服务器设备在异常后快速恢复业务。
根据本发明的一个方面,提供了一种云计算集群服务器状态监控系统,包括:集群服务器10,包括多个云计算服务器1,2,3;备份服务器11,连接到集群服务器10的多个云计算服务器,用于对该多个云计算服务器的数据进行备份;设备感知服务器12,连接到所述集群服务器10和备份服务器11,用于感知集群服务器10和备份服务器11的异常情况。
其中,所述设备感知服务器12感知集群服务器10中某台云计算服务器的业务模块异常,当该云计算服务器的某个业务模块异常时,所述感知服务器12评估异常风险并报警。
其中,所述设备感知服务器12感知的业务模块包括网页处理模块、用户交互管理模块及用户数据存储模块。
进一步,所述设备感知服务器12对感知的异常情况报文进行判断,并根据异常服务器的功能及异常模块的类型做出相应的异常情况恢复和操作处理。
根据本发明的另一方面,提供了一种云计算集群服务器状态监控方法,包括如下步骤:
流量检查步骤,所述设备感知服务器对每个服务器的发报文和收报文进行统计,当在一定时间内只有发送报文或者接收报文时,或者没有报文时,所述感知服务器发送状态请求报文;
异常检测步骤,当集群服务器接收到所述设备感知服务器的状态请求报文后,根据状态请求报文的类型对本服务器的指定业务模块进行检查,并返回业务模块状态;
异常处理步骤,所述设备感知服务器判断此所述服务器设备是否异常,再根据服务器设备所处的功能是主服务器还是备份服务器来做出相应的判断处理。
更进一步地,所述异常处理步骤中,在所述设备感知服务器判断主服务器模块异常的情况下,如果异常的模块为非数据模块,则通知异常服务器设备重启异常模块。
更进一步地,所述异常处理步骤中,在所述设备感知服务器判断主服务器模块异常的情况下,如果异常的模块为数据模块,说明数据损坏,需要快速进行数据恢复,则发送重启消息给异常服务器设备,并激活备份服务器设备。
更进一步地,所述异常处理步骤中,在所述设备感知服务器判断备份服务器异常的情况下,则只对备份数据发送重启消息。
本发明具有以下的优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉柏科技有限公司,未经汉柏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310372875.X/2.html,转载请声明来源钻瓜专利网。