[发明专利]一种基于资源共享自适应配置的GPU虚拟化QoS控制系统及方法在审
申请号: | 201810454727.5 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108733490A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 管海兵;卢秋旻;姚建国 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 虚拟化 工作负载 自适应配置 资源共享 并发 服务质量水平 云系统平台 调度模块 计算资源 监控模块 控制模块 系统平台 资源容量 可接受 云计算 占用率 帧率 共享 分配 | ||
1.一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,所述控制系统构建在基于Xen平台的虚拟化云架构之上,其特征在于,包括:监控模块、控制模块和调度模块,三个模块分别实现并插入到Xen平台的不同层级和组件中,所述监控模块收集从客户虚拟机和物理机内核上开放的接口记录的运行时数据;所述控制模块接收汇总数据,并根据运行时状态计算对资源分配的调整来趋近QoS目标,所述调度模块获取控制模块提交的调整指令,然后在调整后的资源容量限制下,对客户虚拟机进行上下文切换的调度,在QoS约束下在所有虚拟化云计算工作负载之间进行GPU资源容量共享和分配。
2.根据权利要求1所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述调度模块包含在内核驱动模块之中,直接操纵所有的虚拟GPU设备,实现时间槽分配和上下文切换。
3.根据权利要求2所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述内核驱动模块与用户空间之间添加一个接口来接收GPU容量配置,通过该接口,内核中的调度进程响应来自控制模块的对于GPU容量限制进行改变的请求,当接收到请求时,调度过程不需要立即响应配置变化,容量参数将每次在确定的时间间隔后进行更新,来平衡响应速度和额外开销。
4.根据权利要求1所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述监控模块负责监视所有正在运行的虚拟机,记录所有状态数据并汇总作为控制模块的数据输入,所述数据输入包括工作负载FPS和GPU利用率。
5.根据权利要求1所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述控制模块包括一个闭环控制结构,所述闭环控制结构建立起从监控模块中获得的QoS反馈数据以及向调度模块提交的资源容量配置调整之间的联系。
6.一种基于资源共享自适应配置的GPU虚拟化QoS的控制方法,根据权利要求1所述的控制系统实现的,其特征在于,包括如下步骤:
步骤S1:在GPU虚拟化架构的基础上,动态配置每个虚拟机用的GPU资源容量的调度模块,然后根对所有虚拟机之间的上下文切换调度进行操作调整;
步骤S2:配置一个闭环控制结构,所述闭环控制结构检测并确保提供虚拟化GPU资源的云计算平台上所有工作负载的QoS水平;
步骤S3:控制结构将根据通过监视模块的监视功能接收到的QoS反馈,从中计算出当前QoS状态和预先配置的QoS目标差距,并以此为参考尝试动态调整每个包含工作负载的虚拟机相应的资源容量配置,达到调整QoS的目的。
7.根据权利要求6所述的一种基于资源共享自适应配置的GPU虚拟化QoS的控制系统,其特征在于,所述监控模块负责监视所有正在运行的虚拟机,记录所有状态数据并汇总作为控制模块的数据输入,所述数据输入包括工作负载FPS和GPU利用率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810454727.5/1.html,转载请声明来源钻瓜专利网。