[发明专利]一种集群升级方法及装置有效
申请号: | 201610526175.5 | 申请日: | 2016-07-05 |
公开(公告)号: | CN107589951B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张伟 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06F8/65 | 分类号: | G06F8/65 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 升级 方法 装置 | ||
本发明实施例公开了一种集群升级方法及装置,应用于云计算集群中的任一节点,该方法包括:接收升级指令,其中,所述升级指令包括升级文件的标识;根据所述升级文件的标识,获取升级文件;根据所述升级文件,进行升级配置;在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。应用本发明实例,可以提高整个集群的服务能力。
技术领域
本发明涉及云计算技术领域,特别涉及一种集群升级方法及装置。
背景技术
在大规模云计算集群中,整体架构分为控制节点、计算节点、网络节点和存储节点。控制节点接收用户的服务请求,并将任务下发给计算节点、网络节点和存储节点,由位于相应节点中的各服务进程提供实际资源。实际应用中,由于集群架构调整或产品新功能上线等因素需要对集群中的各个节点进行升级,而升级过程中可能会产生异常,导致上述节点无法继续响应用户发起的新服务请求,也就是用户发起的新服务请求被迫异常中断。为保证升级过程中用户发起的新服务请求不被异常中断,对各个节点进行升级时,往往会禁用控制节点中的服务,也就是停止了对用户发起的新服务请求的响应,进而也就不再向计算节点、网络节点和存储节点下发新的任务,这样带来集群服务能力的暂停。
为了解决上述问题,使集群在升级过程中可以继续响应用户发起的新服务请求,可以通过分区滚动升级方式实现集群各个节点的升级。
分区滚动升级方式,是人为地将整个集群所包含的节点划分为多个升级域,每一次升级针对一个升级域。对一个升级域所包含节点进行升级时,该升级域内的节点不接收控制节点下发的新任务,也就是不用于响应用户发起的新服务请求,而是由其他未升级或已升级的升级域中的节点来响应用户发起的新服务请求,这样即使正在升级的升级域产生异常,整个集群仍然可以继续响应用户发起的新服务请求。
使用这种升级方式,虽然可以实现整个集群的整体不间断服务,但是对一个升级域进行升级时,只有该升级域内所有节点均完成升级,才认为完成了针对该升级域的升级,该升级域所包含的节点才可以再次用于响应用户发起的新服务请求。这样对于单个节点而言,处于无法响应用户发起的新服务请求的时间较长,从而降低了整个集群的服务能力。
发明内容
本发明实施例的目的在于提供一种集群升级方法及装置,以提高整个集群的服务能力。
为达到上述目的,本发明实施例公开了一种集群升级方法,应用于云计算集群中的任一节点,所述方法包括步骤:
接收升级指令,其中,所述升级指令包括升级文件的标识;
根据所述升级文件的标识,获取升级文件;
根据所述升级文件,进行升级配置;
在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
可选的,所述在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级,包括:
检测当前服务进程是否有任务正在进行;
如果有,在预设时长后返回执行所述检测当前服务进程是否有任务正在进行的步骤;
如果没有,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测当前服务进程是否有任务正在运行的步骤,如果是,重新启动所述当前服务进程以完成节点升级。
可选的,所述方法还包括:
在重新启动所述当前服务进程后,根据所述升级文件对应的验证文件,验证升级结果。
可选的,
在所述接收升级指令后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610526175.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:管理安装文件的方法和装置
- 下一篇:智能升级方法、装置和系统