[发明专利]一种持续服务的高性能集群操作系统在线升级方法有效
申请号: | 201510369044.6 | 申请日: | 2015-06-29 |
公开(公告)号: | CN105005487B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 杨涛;王亚坤;林宇;葛云峰 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F8/65 | 分类号: | G06F8/65 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;张海秀 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算节点 升级 作业请求 集群 操作系统 资源管理系统 集群系统 在线升级 作业调度 操作系统升级 用户满意度 升级步骤 升级改造 分配 装机 服务 隔离 重复 | ||
本发明公开了一种持续服务的高性能集群操作系统在线升级方法,包括:确定集群系统中的一批待升级计算节点,作业调度和资源管理系统将作业请求分配到待升级计算节点之外的计算节点上,在待升级计算节点处理完其节点上的作业请求后,隔离待升级计算节点,由集群装机系统进行待升级计算节点的操作系统的升级;完成升级后,作业调度和资源管理系统控制部分用户通过第二提交节点向高性能集群系统提交作业请求,并将该部分用户的作业请求分配到升级后的计算节点上;之后确定新一批待升级计算节点,重复升级步骤直至完成所有计算节点的操作系统升级。该方法可在保持持续服务的状态下对集群进行升级改造,且升级对用户的影响较小,提高了用户满意度。
技术领域
本发明属于高性能科学计算领域,具体涉及一种持续服务的高性能集群操作系统在线升级方法。
背景技术
随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高,越来越多的领域对高性能计算的需求迅猛增长。高性能计算(High performance computing,缩写HPC)指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)的计算系统和环境。有许多类型的HPC系统,其范围从标准计算机的大型集群,到高度专用的硬件。大多数基于集群的HPC系统使用高性能网络互连,比如基于InfiniBand(40GB或56GB带宽)的网络互连。基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的环境中,网状网络系统在主机之间提供较短的潜伏期,所以可改善总体网络性能和传输速率。
高性能计算集群,英文原文为High Performance Computing Cluster,简称HPC集群,是指以提高科学计算能力为目的计算机集群技术。HPC集群上的软件安装和配置是一个比较复杂的工作,特别是集群规模达到100个以上的时候。随着操作系统的不断升级和工具软件的优化,如何在保持持续服务的状态下对集群进行升级改造,让升级对上层的实际用户透明化,是现有HPC集群操作系统升级中HPC管理员所面临的挑战,本发明正是针对该问题而提供的一种持续服务的高性能集群操作系统在线升级方法。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种持续服务的高性能集群操作系统在线升级方法,该方法可在保持持续服务的状态下对集群进行升级改造。
为实现上述目的,本发明采用的技术方案如下:
一种持续服务的高性能集群操作系统在线升级方法,包括以下步骤:
(1)将待升级的高性能集群系统的计算节点进行分批,确定一批当前的待升级计算节点;
(2)高性能集群系统的作业调度和资源管理系统控制用户通过第一提交节点向高性能集群系统提交作业请求,并由管理节点将用户提交的作业请求分配到所述待升级计算节点之外的计算节点上;
(3)所述待升级计算节点处理完其节点上的作业请求后,隔离所述待升级计算节点,由高性能集群系统的集群装机系统进行所述待升级计算节点的操作系统的升级;
(4)完成所述待升级计算节点的操作系统的升级后,作业调度和资源管理系统控制部分用户通过第二提交节点向高性能集群系统提交作业请求,并由管理节点将该部分用户提交的作业请求分配到完成升级后的计算节点上;
(5)确定新的一批待升级计算节点,作业调度和资源管理系统的管理节点将用户提交的作业请求分配到所述待升级计算节点之外的计算节点上,重复步骤三和步骤四直至完成所有高性能集群系统中所有计算节点的操作系统的升级。
进一步,如上所述的一种持续服务的高性能集群操作系统在线升级方法,步骤(2)中,所述第一提交节点为与升级前的计算节点的操作系统相匹配的提交节点;步骤四中,所述第二提交节点为与升级后的计算节点的操作系统相匹配的提交节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510369044.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:粉皮干燥机
- 下一篇:高速列车产品配置平台及配置方法