[发明专利]通讯系统集群方法、装置及应用其的集群服务系统有效
申请号: | 200710121307.7 | 申请日: | 2007-09-03 |
公开(公告)号: | CN101119242A | 公开(公告)日: | 2008-02-06 |
发明(设计)人: | 陈正光 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L1/22;H04L12/28 |
代理公司: | 北京律诚同业知识产权代理有限公司 | 代理人: | 梁挥;祁建国 |
地址: | 518057广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通讯 系统 集群 方法 装置 应用 服务 | ||
技术领域
本发明涉及通讯集群领域,特别涉及一种通讯系统集群方法和装置以及应用该集群方法和装置的集群服务系统。
背景技术
目前,通讯业务如火如荼展开,通讯业务成了人们日常生活中不可或缺的一部分。为了确保通信服务器的长期稳定运行,对其部分部件提供了冗余设计,如电源、网卡的冗余备份,硬盘镜像等。但是,在系统层面,如果服务器的关键部件发生故障,如中央处理器CPU故障、内存故障、主板故障等,则整个服务器停止运行,结果会严重影响整个通讯系统,如造成业务中断等;在应用方面,如果应用程序发生故障,异常退出,停止提供应用服务,结果同样会严重影响整个通讯系统的正常运行。
在系统方面,现有技术提供了集群技术,其基本原理是利用两台服务器进行双机备份,双机之间采用多种通讯方式进行检测监控,如双机之间采用串口心跳连接,双机网卡连接到同一局域网上。在一台服务器发生故障时,另外一台服务器能及时检测异常,并接管发生故障的服务器的业务。如图1所示,服务器1和服务器2组成双机集群系统,它们共享存储介质,服务器1和服务器2采用串口心跳连接,并通过路由器现局域网连接,在服务器1停止工作时,服务器2能接管其业务,发生业务切换时,在接管业务的服务器2,集群系统采用脚本启动应用程序,在发生故障的服务器1,集群系统采用脚本终止应用程序。
在应用方面,尽管集群系统提供监控脚本功能,但该功能很难用来实现对应用程序的有效监控。因此,现有技术往往采用软件看门狗技术,其基本原理是在服务器上运行看门狗程序,该程序负责监控管理应用进程,监控发现应用进程异常时,能重启应用程序,从而保证应用的正常运行。
但现有技术在应用和系统方面还存在如下问题:
在应用方面,看门狗采用加锁机制,在单个服务器中唯一,占用专用的共享内存等系统资源。看门狗的独享机制,导致在集群系统中,例如双机系统中,同一时刻只能有一台服务器上运行看门狗及其监控的业务应用。为保证看门狗的正常运行,看门狗监控的程序在看门狗启动时即已确定,并且监控的程序能被看门狗程序正常启动。
在系统方面,由于采用脚本难以检测业务进程的状态,例如业务进程吊死,所以,为保证系统可靠性,需要采用看门狗软件管理业务进程。同时现有技术在配置集群系统发生服务切换运行脚本时,一般通过启动和杀死看门狗程序实现启动和停止业务应用。这种机制也决定了看门狗程序在集群系统服务器中唯
综上,在现有技术集群系统中,对于多节点负荷分担通讯业务,看门狗的特性决定了集群系统中双机中只能运行一个看门狗管理的业务应用,在双机上运行单一类型应用时,只能采用主备方式,空闲备机,导致现有集群应用方式在系统利用上的资源浪费。
发明内容
本发明所要解决的技术问题在于,提供一种通讯系统集群方法和装置以及应用该集群方法和装置的集群服务系统,以实现通讯业务双机互备援或/和多节点互备援集群,更有效的利用现有通讯设备资源。
为达到上述目的,本发明提供的通讯系统集群方法,用于实现双机互备援和/或多节点互备援集群,包括:
应用组划分步骤,用于将预定的一系列在同一台服务器运行的应用和资源作为一应用组,并根据通信业务功能将所述应用组进行区分;
业务看门狗程序启动步骤,用于获取看门狗进程所在应用组所需的系统资源,启动该看门狗进程监控的业务进程并完成该看门狗进程的启动设置。
上述通讯系统集群方法,所述业务看门狗程序启动步骤进一步包括:
步骤A,所述看门狗进程获取其所在应用组标识信息;
步骤B,根据所述应用组标识信息应用命名算法生成所述看门狗进程所需的系统资源名;
步骤C,所述看门狗进程根据所述系统资源名检查并获取该看门狗进程所需系统资源;
步骤D,所述看门狗进程获取应用组配置信息启动被监控业务进程;
步骤E,所述看门狗进程完成看门狗的辅助启动设置。
上述通讯系统集群方法,所述业务看门狗程序启动步骤还包括:根据定时器定时检查被监控业务进程状态的步骤。
上述通讯系统集群方法,所述步骤C进一步包括一判断所述看门狗进程是否成功获取系统资源的步骤,如成功继续执行所述步骤D;否则,所述看门狗进程记录错误日志信息并退出。
上述通讯系统集群方法,所述步骤D中,被监控业务进程的启动步骤进一步包括:
步骤D1,所述业务进程获取其所在应用组标识信息;
步骤D2,根据所述应用组标识信息应用命名算法生成该业务进程所需的系统资源名;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710121307.7/2.html,转载请声明来源钻瓜专利网。