[发明专利]一种数据中心集群多活仲裁方法及系统在审
申请号: | 202211417260.X | 申请日: | 2022-11-14 |
公开(公告)号: | CN116016542A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 范日明;罗云鹤;黄松钦;杨丰嘉 | 申请(专利权)人: | 天翼云科技有限公司 |
主分类号: | H04L67/1042 | 分类号: | H04L67/1042;H04L41/0668;H04L43/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100010 北京市东城区青*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据中心 集群 仲裁 方法 系统 | ||
本发明公开了一种数据中心集群多活仲裁方法及系统,包括:对数据中心集群的各个数据中心配置仲裁服务,基于仲裁服务采集本地链路状态并同步数据中心;数据中心通过竞选成为leader接管仲裁权,成为仲裁数据中心;同一仲裁周期内,当某个数据中心的心跳或链路状态异常则判断为异常数据中心;仲裁数据中心通知集群管理服务对异常数据中心的业务进行故障迁移,调度到健康的数据中心。本发明提出一种多数据中心共同参与的、去中心化的、可灵活扩容的仲裁方法,能够提高仲裁决策可靠性和准确度。
技术领域
本发明属于电通信技术、计算机、数据交换网络领域,特别是涉及一种数据中心集群多活仲裁方法及系统。
背景技术
在数据中心集群多活架构中,需要通过第三方仲裁来进行健康采集、状态监控以及故障迁移决策,当检测到某个数据中心故障时,将该故障点的业务迁移到其他健康的可用区中。
当前,业内的惯用的做法是引入一个固定的第三方仲裁点,这种方法依赖仲裁点和被监控节点之间的链路保障,如果有由于链路问题导致失联,则只能依靠业务节点设置的优先级作为判断的依据,这将会造成不必要的业务抖动、甚至有误判的风险。
发明内容
为解决上述问题提出一种多数据中心共同参与的、去中心化的、可灵活扩容的仲裁方法,提高仲裁决策可靠性和准确度。
为实现上述目的,本发明提供了如下方案:一种数据中心集群多活仲裁方法,包括:
对数据中心集群的各个数据中心配置仲裁服务,基于所述仲裁服务采集本地链路状态并同步所述数据中心;所述数据中心通过竞选成为leader接管仲裁权,成为仲裁数据中心;
同一仲裁周期内,当某个数据中心的心跳或链路状态异常则判断为异常数据中心;所述仲裁数据中心通知集群管理服务对所述异常数据中心的业务进行故障迁移,调度到健康的数据中心。
优选地,所述数据中心集群的构建过程包括,
对每个数据中心规划独立的网段,并基于高质量的互联链路三层互通,所述数据中心的独立网段通过交换机接入裸线或VPN线路做路由打通,交换机开启组播转发功能,获得数据中心集群。
优选地,对数据中心集群的各个数据中心配置仲裁服务通过多方组播心跳保活机制对每个数据中心部署两个副本,基于仲裁周期内的心跳合并和组播发布机制对数据中心的leader选举、心跳、服务自检、健康状态进行采集。
优选地,基于仲裁周期内的心跳合并和组播发布机制对数据中心的leader选举、心跳、服务自检、健康状态进行采集的过程包括,
所述数据中心自检检测所在数据中心链路和集群状态是否正常,若自检不正常,所述数据中心主动放弃leader竞选和已经获得的leader角色,直至自检正常再次参与竞选;若自检正常,参与leader竞选,通过选举获得leader权限之后,负责采集数据和仲裁决策。
优选地,采集数据和仲裁决策的过程包括,
发起组播心跳,获取心跳周期内本数据中心的心跳统计,同步更新数据中心状态;并整合心跳周期内其他数据中心的心跳信息,对其他数据中心的心跳信息进行合并、去重。
优选地,所述数据中心通过竞选成为leader接管仲裁权,成为仲裁数据中心的过程还包括,
所述数据中心通过竞选成为leader,预设仲裁周期与周期ID之后收到多于仲裁周期/心跳周期次其他数据中心的心跳信息,成为仲裁数据中心获得仲裁权。
优选地,所述仲裁方法还包括对数据中心集群的动态扩容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼云科技有限公司,未经天翼云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211417260.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卧式CT检测设备
- 下一篇:一种油纸绝缘介电响应等效模型建模方法