[发明专利]一种云计算环境中GPU资源调度系统在审
申请号: | 202110233042.X | 申请日: | 2021-02-23 |
公开(公告)号: | CN113094169A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 李健 | 申请(专利权)人: | 北京蓝耘科技股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 环境 gpu 资源 调度 系统 | ||
本发明公开了一种云计算环境中GPU资源调度系统,包括:任务导入模块,用于将应用程序发出的调用任务导入到微环境中;任务分析模块,用于分析调用任务,并根据调用任务需要调用的GPU资源的多少发出GPU调用请求;资源打分模块,用于以显存利用率、GPU利用率、GPU功耗三项作为变量对可用GPU资源进行打分;资源排序模块,用于根据分数高低对可用GPU资源进行排序;资源重定向模块,用于使微环境根据GPU调用请求在多个计算节点的多个GPU设备间选择出分数高且分数差值最小的相应数量的可用GPU资源分配给应用程序。通过微环境可以在多个计算节点的多个GPU设备间为某个特定的应用程序分配合适的GPU资源,实现了GPU资源的有效利用。
技术领域
本发明涉及云计算的技术领域,具体来说,涉及一种云计算环境中GPU资源调度系统。
背景技术
云计算指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。云计算是网格计算、分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。
但是现有的云计算系统在特定的时刻,一个计算节点最多只能为单个调用任务提供服务,为使单个计算节点可以满足调用任务的需求,使得云计算系统对单个计算节点的硬件要求非常高。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种云计算环境中GPU资源调度系统,可解决上述现有技术中的不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种云计算环境中GPU资源调度系统,包括:
任务导入模块,用于将应用程序发出的调用任务导入到微环境中;
任务分析模块,用于分析所述调用任务,并根据所述调用任务需要调用的GPU资源的多少发出GPU调用请求;
资源打分模块,用于以显存利用率、GPU利用率、GPU功耗三项作为变量对可用GPU资源进行打分;
资源排序模块,用于根据分数高低对所述可用GPU资源进行排序;
资源重定向模块,用于对DirectX接口进行重定向,以使所述微环境根据所述GPU调用请求在多个计算节点的多个GPU设备间选择出分数高且分数差值最小的相应数量的所述可用GPU资源分配给所述应用程序。
进一步地,所述任务导入模块包括多个程序接口,用于与应用程序进行通信,以获取所述调用任务。
进一步地,还包括GPU调用模块,用于与硬件设备进行通信,以供所述微环境调用所述GPU设备。
进一步地,所述显存利用率的计算公式为Sm=(TM-UM)*VM/TM,其中,Sm为显存利用率,TM为显存总量,UM为已用显存量,VM为相关影响因子的阈值;所述GPU利用率的计算公式为Su=(1-Ugpu)*10,其中,Su为GPU利用率,Ugpu表示显卡利用率;所述GPU功耗的计分公式为Sp=(TP-UP)*VP/TP,其中,Sp为GPU功耗,TP为最大功率,UP为已用功率,VP为相关影响因子的阈值;对所述可用GPU资源进行打分的计算公式为SG_i=xSm+ySu+zSp,其中i为可用GPU资源的编号。
进一步地,所述资源打分模块还用于在所述GPU功耗和/或所述显存利用率达到设定的低值时,将对应的所述GPU资源作为不可用GPU资源。
进一步地,在S6中,还包括记录模块,用于记录对当前所述应用程序进行所述可用GPU资源分配的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京蓝耘科技股份有限公司,未经北京蓝耘科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110233042.X/2.html,转载请声明来源钻瓜专利网。