[发明专利]一种云计算环境中GPU资源调度系统在审
申请号: | 202110233042.X | 申请日: | 2021-02-23 |
公开(公告)号: | CN113094169A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 李健 | 申请(专利权)人: | 北京蓝耘科技股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 环境 gpu 资源 调度 系统 | ||
1.一种云计算环境中GPU资源调度系统,其特征在于,包括:
任务导入模块,用于将应用程序发出的调用任务导入到微环境中;
任务分析模块,用于分析所述调用任务,并根据所述调用任务需要调用的GPU资源的多少发出GPU调用请求;
资源打分模块,用于以显存利用率、GPU利用率、GPU功耗三项作为变量对可用GPU资源进行打分;
资源排序模块,用于根据分数高低对所述可用GPU资源进行排序;
资源重定向模块,用于对DirectX接口进行重定向,以使所述微环境根据所述GPU调用请求在多个计算节点的多个GPU设备间选择出分数高且分数差值最小的相应数量的所述可用GPU资源分配给所述应用程序。
2.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,所述任务导入模块包括多个程序接口,用于与应用程序进行通信,以获取所述调用任务。
3.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,还包括GPU调用模块,用于与硬件设备进行通信,以供所述微环境调用所述GPU设备。
4.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,所述显存利用率的计算公式为Sm=(TM-UM)*VM/TM,其中,Sm为显存利用率,TM为显存总量,UM为已用显存量,VM为相关影响因子的阈值;所述GPU利用率的计算公式为Su=(1-Ugpu)*10,其中,Su为GPU利用率,Ugpu表示显卡利用率;所述GPU功耗的计分公式为Sp=(TP-UP)*VP/TP,其中,Sp为GPU功耗,TP为最大功率,UP为已用功率,VP为相关影响因子的阈值;对所述可用GPU资源进行打分的计算公式为SG_i=xSm+ySu+zSp,其中i为可用GPU资源的编号。
5.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,所述资源打分模块还用于在所述GPU功耗和/或所述显存利用率达到设定的低值时,将对应的所述GPU资源作为不可用GPU资源。
6.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,在S6中,还包括记录模块,用于记录对当前所述应用程序进行所述可用GPU资源分配的情况。
7.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,还包含监视模块,用于实时监视所有所述GPU设备的工作状态,以获取所述显存利用率、所述GPU利用率以及所述GPU功耗。
8.根据权利要求1所述的云计算环境中GPU资源调度系统,其特征在于,所述资源重定向模块还用于在所述可用GPU资源不足时,将所述调用任务挂起等待调度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京蓝耘科技股份有限公司,未经北京蓝耘科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110233042.X/1.html,转载请声明来源钻瓜专利网。