[发明专利]以用户为核心的高性能计算机资源管理方法在审
申请号: | 201910788892.9 | 申请日: | 2019-08-26 |
公开(公告)号: | CN112433829A | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 陈德训;刘鑫;范昊;钱宇;徐金秀;张宏宇 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214083 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 核心 性能 计算机 资源管理 方法 | ||
本发明公开一种以用户为核心的高性能计算机资源管理方法,基于以下模块:用户队列模块,包含所有使用高性能计算机系统的用户,每个用户可以使用1~2个有限队列资源;计算队列模块,可包含高性能计算机系统中所有的计算节点,且每个计算节点只能加入到一个计算队列;计算节点队列模块,将计算节点按照该节点的网络地址进行编号;资源管理系统,当用户队列模块中的用户向计算队列模块中的计算队列提交作业时,用于判断该用户下面是否包含有该队列。本发明解决了大型超算中心计算资源管理低效问题,提高高性能计算机系统计算资源的管理和服务能力。
技术领域
本发明涉及一种以用户为核心的高性能计算机资源管理方法,属于计算机技术领域。
背景技术
高性能计算机系统主要部署在不同级别的超算中心,通过网络面向各领域提供计算服务,根据超算中心所能提供计算资源的能力,用户规模可以从数十个到数万个不等。伴随着超级计算机的出现和发展,超级计算机的计算资源从单计算节点发展到当前的数万计算节点,计算核心数从单计算核心发展到现在的上千万核心,用户数从几个用户到上万用户,如何有效管理和调度这些计算资源与用户的关系,超级计算机的资源管理系统发挥着重要的作用。在高性能计算机系统中,计算队列数是有限的,但用户数是不断扩展的。传统的资源管理软件在用户数量上主要考虑百用户量级,当用户量达到上千、上万量级以后,已有管理策略效率低下,已经不适应现在大型超算中心对高性能计算机资源管理的需求。
目前高性能计算机系统部署的资源管理软件在计算资源的管理上主要以计算队列为核心,每个计算队列分配给不同的用户使用。对于浮点运行速度达到亿亿次量级以上的高性能计算机系统,当用户量达到千量级以上时,现有以计算队列为核心的资源管理软件,每个计算队列可能要分配上千个用户,但往往一个用户一般只使用1~2个或者有限的计算队列,这样造成了资源管理的灵活度和管理效率大大降低,资源管理复杂,计算资源利用率降低,同时增加了系统管理人员的工作负担。
发明内容
本发明的目的是提供一种以用户为核心的高性能计算机资源管理方法,该以用户为核心的高性能计算机资源管理方法解决了大型超算中心计算资源管理低效问题,提高高性能计算机系统计算资源的管理和服务能力。
为达到上述目的,本发明采用的技术方案是:一种以用户为核心的高性能计算机资源管理方法,基于以下模块:
计算队列模块,包含高性能计算机系统中所有的计算节点,且每个计算节点只能加入到一个计算队列,一套高性能计算机系统可创建多个计算队列;
计算节点队列模块,将计算节点按照该节点的网络地址进行统一编号,一套高性能计算机系统只包含一个计算节点队列;
用户队列模块,包含所有使用高性能计算机系统的用户,一套高性能计算机系统只包含一个用户队列,用户队列中的每个用户可以有限使用1~2个计算队列;
资源管理系统,用于管理用户队列、计算队列和计算节点队列,以及管理用户权限、计算任务的执行权限,还用于管理资源分配、任务调度、状态监控、资源回收功能;
所述资源管理方法包括以下步骤:
S1、用户队列A中的任一用户A1通过资源管理系统向计算队列模块B中的某一计算队列B1提交计算任务;
S2、资源管理系统判断用户A1中是否包含有计算队列B1,如果不包含,则用户A1无权使用计算队列B1,此次提交计算任务失败;
S3、如果用户A1中包含有计算队列B1,资源管理系统为用户A1在计算队列B1中分配计算资源,并提交计算任务;
S4、当计算任务运行结束后,资源管理系统回收计算资源给计算队列B1;
S5、资源管理系统一次提交计算任务结束。
上述技术方案中进一步改进的方案如下:
1. 上述方案中,所述用户队列中的任一用户需要提交计算任务时,需为该用户配置相应的计算队列,每个用户可以配置有限个计算队列,同一计算队列可配置给不同用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910788892.9/2.html,转载请声明来源钻瓜专利网。