[发明专利]云平台中服务的分布式管理方法在审
申请号: | 201310252923.1 | 申请日: | 2013-06-24 |
公开(公告)号: | CN103312809A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 杨立涛 | 申请(专利权)人: | 北京汉柏科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100022 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 平台 服务 分布式 管理 方法 | ||
技术领域
本发明涉及云计算技术,特别涉及一种云平台中服务的分布式管理方法。
背景技术
在新型的云计算数据中心,一个站点的云计算平台可能是由成百上千的服务器组成,对于如此庞大的云计算中心,其管理软件系统需要具有非常高的可靠性、健壮性,因此错误检测和快速、自动的恢复无单点故障是云计算管理系统的核心架构设计目标。
目前市场上主流的云计算管理系统主要采用集中式管理模式,其采用一台中央管理机对整个虚拟化平台进行统一控制,在实际应用环境中,很容易出现管理系统与虚拟化平台通信中断的故障,影响系统正常管理与维护,甚至会导致整个云平台瘫痪的严重后果。采用此类架构的解决方案供应商也已意识到了这种集中式管理模式的风险性,其中部分领导厂商在此基础上进行了扩展或者延生,他们的补救措施核心思路就是针对管理中心服务器进行双机热备,甚至个别厂商建议用户采用集群管理中心。但是这种补救措施仍然无法彻底解决集中式管理模式的弊端,同时又造成了用户针对业务运营的额外IT资源投入。
以汉柏OPV-Suite为代表的云计算管理系统致力于采用分布式控制模式解决上述技术难题。若是将管理中心的服务分布到每一台物理主机上,使云平台的管理数据在整个平台内自动同步,便能够使得云计算中的任何一个节点都是管理中心,各节点并发处理又相互备份,无单点故障,从而极大提高云平台的工作可靠性。
发明内容
(一)所要解决的技术问题
本发明的目的在于提供一种云平台中服务的分布式管理方法,以解决云平台集中式管理模式存在的管理中心单点故障、管理中心容易出现性能瓶颈、系统灵活性较差且不易扩张、增加用户额外IT资源投入及维护成本的问题。
(二)技术方案
为了解决上述技术问题,本发明提出了一种云平台中服务的分布式管理方法,所述方法包括以下步骤:
S1、在云平台中的每一个节点上安装云平台运行所需的全部管理服务;
S2、在某一节点m上启动zookeeper服务;
S3、所述zookeeper服务从所有节点中选择某一节点i启动管理服务A,然后由节点i向所有节点提供管理服务A;
S4、当节点i上存储的管理服务A的数据发生变化时,节点i将管理服务A的数据变化消息通知给所述zookeeper服务,所述zookeeper服务将节点i上管理服务A的数据变化消息通知给其他所有节点,其他所有节点根据节点i上管理服务A的数据变化消息更新自身存储的管理服务A的数据。
可选的,步骤S3之后进一步包括步骤:
S5、当节点i失效时,所述zookeeper服务从其他所有节点中选择某一节点j启动管理服务A,然后由节点j向所有节点提供管理服务A。
可选的,步骤S3进一步包括:所述zookeeper服务从所有节点中选择某一节点启动全局检测服务,所述全局检测服务用于检测云平台中节点的增加或失效;
步骤S5具体包括:当所述全局检测服务检测到节点i失效时,所述全局检测服务将节点i的失效消息通知给所述zookeeper服务,所述zookeeper服务从其他所有节点中选择某一节点j启动管理服务A。
可选的,步骤S4之后进一步包括步骤:
S6、当节点m失效时,通过选举策略从其他所有节点中选择某一节点m'启动所述zookeeper服务。
可选的,步骤S1进一步包括:在云平台中选择N个节点安装zookeeper服务,N为正整数,且N≥2;
步骤S2具体包括:在所述N个节点中选择某一节点m启动所述zookeeper服务;
步骤S6具体包括:当节点m失效时,通过选举策略从所述N个节点的其他所有节点中选择某一节点m'启动所述zookeeper服务。
可选的,步骤S3中,所述zookeeper服务从所有节点中随机选择某一节点i启动管理服务A。
可选的,步骤S3进一步包括:所述zookeeper服务从除节点i以外的所有节点中选择某一节点i'启动管理服务A,由节点i'与节点i并发提供管理服务A。
(三)有益效果
与现有的云平台集中式管理模式相比,本发明的技术方案采用分布式管理架构,增强了管理平台的性能和扩展性,同时实现了服务管理自动错误检测和快速恢复无单点故障:
1、避免了云平台管理系统单点故障。一个管理服务死掉后,该服务会被自动重启;一个物理主机死掉后,该主机上的所有服务会被迁移到其他节点上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京汉柏科技有限公司,未经北京汉柏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310252923.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆诊断方法及服务器
- 下一篇:用于分布式系统的诊断方法和诊断系统