[发明专利]民主自治的集群管理方法和系统有效
申请号: | 201410090747.0 | 申请日: | 2014-03-12 |
公开(公告)号: | CN104917792B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 龚敬群 | 申请(专利权)人: | 上海宝信软件股份有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 201203 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种民主自治的集群管理方法,包括步骤:步骤1:集群启动;步骤2:集群运行自治;步骤3:集群分裂自治;步骤4:集群融合自治;步骤5:集群动态伸缩自治;步骤6:集群管理员治理。本发明还提供相应的系统。本发明实现了集群在任意单节点异常、多节点异常时,都具备持续的对外服务、集群管理服务提供能力,还可在任意状态下对集群内节点实施检修升级工作和追加服务节点,对Master的选择不需要第三方服务,完成民主自治选取产生支持集群的分裂自治,提高了容错性和可管理性,本发明还支持管理员的最高管理权限,可广泛应用于需弹性伸缩的、持续服务质量要求高、集群内节点数目大的集群系统管理。 | ||
搜索关键词: | 民主 自治 集群 管理 方法 系统 | ||
【主权项】:
1.一种民主自治的集群管理方法,其特征在于,包括如下步骤:步骤1:集群启动;步骤2:集群运行自治;步骤3:集群分裂自治;步骤4:集群融合自治;步骤5:集群动态伸缩自治;步骤6:集群管理员治理,其中,集群管理员用户集群管理的最高权限,各节点均提供管理员入口,以执行主席节点检修升级、追加服务节点、调整全局策略参数操作;所述步骤1包括如下步骤:步骤101:集群初始化启动时,根据系统管理员的指定指令产生主席节点,其中,所述指定指令在确定主席过程中拥有最高权限;步骤102:除主席节点外,其余节点自动将本节点角色Role置为Slave节点;步骤103:主席节点管理集群的全局配置策略,并将全局策略初始化派送给各Slave节点,其中,所述全局策略初始化包括:全局节点数量、集群标识、各节点名称、各节点角色、各节点监听地址、各节点服务地址、健康检查策略、不信任策略、信息同步策略、信息同步时间间隔、信息同步时间、民主选举策略、各节点当前状态、集群伸缩策略;节点状态包括:启动状态BOOTING:当启动失败时,转入脱离状态;当启动成功时,转入控制状态;脱离状态DISCONN:当收到信息同步指令时,转入控制状态;控制状态CONN:当被认为不健康时,转入脱离状态;当收到隔离指令时,转入隔离状态;当收到待机指令时,转入待机状态;当收到关闭指令时,转入关闭进行状态;关闭进行状态SHUTDOWING:当关闭结束后,转入关闭结束状态SHUTDOWNED;隔离状态ISOLATED:当收到集合指令时,转入控制状态;待机状态IDLE:当收到隔离指令时,转入隔离状态;当收到恢复指令时,转入控制状态;当收到关闭指令时,转入关闭进行状态;未定义状态UNASSIGNED:当收到启动指令时,转入启动状态;当收到信息同步指令时,转入控制状态;所述步骤2包括如下步骤:步骤201:各节点按照信息同步策略及信息同步时间间隔,将自身状态信息块同步给集群中其他节点,其中,所述信息同步策略包括增量同步和海量同步;步骤202:主席节点将全局信息按照信息同步策略及信息同步时间间隔,将集群全局信息同步给所有Slave节点,信息同步策略包括增量同步和海量同步;步骤203:所有节点接收到其他节点的同步信息后,在BBS中更新相应节点信息存储内存块中;步骤204:Slave节点在接收到主席节点全局同步信息时,更新BBS中主席节点信息存储内存块及全局配置变化的参数,比较其余节点更新时间与全局信息包中子项的时间,将BBS中Slave节点信息内存块的信息更新为最新状态值;步骤205:所有节点按照全局健康检查策略检查各自BBS块中其他节点状态,并维护管理节点状态,其中,健康检查策略由检查周期Th、状态裁定周期n*Th决定;步骤206:主席节点执行步骤205操作,当裁定Slave节点状态为脱离状态DISCONN、或者未定义状态UNASSIGNED时,对Slave执行Boot指令;步骤207:Slave节点执行步骤205,根据不信任策略,当裁定主席节点状态为脱离状态DISCONN时,执行步骤208选举操作;不信任策略为健康检查策略与管理员操作的综合策略;步骤208:Slave节点根据选举策略进行民主选举:当集群节点数M=2时,Slave节点自动升级为主席节点;当集群节点数M=3时,Slave节点IP地址小者升级为主席节点;当集群节点数M≥4时,Slave节点向其他Slave节点推举处于控制状态CONN中最小IP者为候选节点,得票多者为为临时主席节点,Slave节点等待临时主席节点的确认公告信息,并发送认可公告,当临时主席节点收到100%的认可后,即成为主席节点,否则重复执行步骤208;在所述步骤208中,选举策略参数可配置为最小IP优先、或者最大IP优先;所述步骤3,包括如下步骤:步骤301:集群C={N1,N2,N3…Nm},m为集群C中的节点数量,所有节点N1,N2,N3…Nm执行步骤205,将所有非脱离状态DISCONN的节点形成若干个包含本Slave节点的C的真子集SC,n为集群SC中的节点数量,根据网络特性,约束所有真子集间没有交集,即步骤302:含有主席节点的真子集形成一个独立的分裂子集群,进行集群运行自治管理步骤201~步骤208;步骤303:不含主席节点的真子集{SC1,SC2,SC3…SCn}执行步骤208,形成各自独立的分裂子集群,进行集群运行自治管理;所述步骤4包括如下步骤:步骤401:所有子集群Slave节点执行步骤201、203、204,所有子集群主席节点执行步骤202;步骤402:当Slave节点在执行步骤204时,若收到来自当前子集群标识之外的主席节点全局同步信息时,比较两个主席节点的IP信息,选择IP较小者加入,并脱离另外一个子集群;步骤403:当主席节点收到来自当前子集群标识之外的主席节点全局同步信息时,若该主席节点IP小于自身值,则放弃当前主席身份,作为Slave节点加入到该子集群;所述步骤5包括如下步骤:步骤501:主席节点按周期tl、调整周期数N检查集群内各节点负荷NLmNtl,其中,m为集群节点数,N为负荷调整周期数,tl为负荷周期,当综合负荷CLn满足时,其中,σ为弹性伸缩下限值,发送待机指令给当前集群内IP最大值Slave节点,并将停止该节点对外服务的消息广播到集群内其他Slave节点,该Slave节点完成当前工作后即处于待机状态IDLE,释放系统资源;步骤502:主席节点按周期检查集群内各节点负荷NLmNtl,当综合负荷满足时,其中,λ为弹性伸缩上限值,查找当前集群内是否存在待机状态IDLE的节点,如果存在,主席节点发送启用命令到处于待机状态IDLE中IP值最大的节点,将其重新加入到集群中;所述步骤6包括如下步骤:步骤601:系统管理员登录任何一个节点,执行获取主席节点管理权指令,当前节点将指令发送给主席节点,若获得回复,则修改节点修改角色状态标识ROLE=M以变为主席节点,主席节点修改角色状态标识ROLE=S以变为Slave节点,当前节点接替成为主席节点执行集群管理职责步骤202、步骤206;步骤602:选择需要检修升级节点之外的其他任意节点,执行步骤601获得管理员主席权限,对待检修升级节点执行隔离指令,当该节点处于隔离状态ISOLATED时,对该节点实施检修、升级操作,此时,该节点处于不提供服务状态,当完成检修工作后,执行集合指令恢复;步骤603:准备好需要追加的集群服务节点执行步骤601,执行追加导入指令其中,URL_LIST为URL列表信息,为对应节点的URL,主席节点将全局集群URL列表信息URL_LIST导入到节点同时将追加到集群;集群执行步骤402、步骤403。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝信软件股份有限公司,未经上海宝信软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410090747.0/,转载请声明来源钻瓜专利网。