[发明专利]服务器GPU性能调控方法、装置、设备及可读存储介质有效
申请号: | 201910656862.2 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110427300B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王继玉 | 申请(专利权)人: | 广东浪潮大数据研究有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F1/20;G06F1/3234 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 侯珊 |
地址: | 510620 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 gpu 性能 调控 方法 装置 设备 可读 存储 介质 | ||
1.一种服务器GPU性能调控方法,其特征在于,包括:
当检测到服务器启动完成时,判断服务器GPU当前是否处于模型训练状态;
若否,则利用PID调控算法调节服务器风扇转速对所述服务器GPU进行性能调控;
若是,则获取所述服务器GPU的温度值;当所述温度值处于低级GPU温度阈值范围或中级GPU温度阈值范围时,通过将所述服务器风扇转速调控到对应级别对所述服务器GPU进行性能调控;
当所述温度值处于高级GPU温度阈值范围时,利用高级服务器风扇转速对所述服务器GPU进行性能调控;若利用所述高级服务器风扇转速对所述服务器GPU进行性能调控预设时长后,所述服务器GPU的温度值未低于预设温度值,则将所述服务器GPU的功耗调整到预设额定功耗,以使所述服务器GPU降频进入低功耗运行模式;其中,预设有各GPU温度阈值范围与各级别调控策略之间的对应关系。
2.根据权利要求1所述的服务器GPU性能调控方法,其特征在于,在检测到服务器启动完成之后,判断服务器GPU当前是否处于模型训练状态之前,还包括:
对服务器运行环境进行检测,得到检测结果;
当根据所述检测结果确定服务器驱动和工具版本有误时,输出安装正确服务器驱动和工具版本的提示信息。
3.根据权利要求2所述的服务器GPU性能调控方法,其特征在于,还包括:
获取调控效果信息;
对所述调控效果信息进行显示操作。
4.一种服务器GPU性能调控装置,其特征在于,包括:
判断模块,用于当检测到服务器启动完成时,判断服务器GPU当前是否处于模型训练状态;
第一调控模块,用于在确定服务器GPU当前未处于模型训练状态时,利用PID调控算法调节服务器风扇转速对所述服务器GPU进行性能调控;
第二调控模块,用于在确定服务器GPU当前处于模型训练状态时,获取所述服务器GPU的温度值;当所述温度值处于低级GPU温度阈值范围或中级GPU温度阈值范围时,通过将所述服务器风扇转速调控到对应级别对所述服务器GPU进行性能调控;当所述温度值处于高级GPU温度阈值范围时,利用高级服务器风扇转速对所述服务器GPU进行性能调控;若利用所述高级服务器风扇转速对所述服务器GPU进行性能调控预设时长后,所述服务器GPU的温度值未低于预设温度值,则将所述服务器GPU的功耗调整到预设额定功耗,以使所述服务器GPU降频进入低功耗运行模式;其中,预设有各GPU温度阈值范围与各级别调控策略之间的对应关系。
5.根据权利要求4所述的服务器GPU性能调控装置,其特征在于,还包括:
检测结果获得模块,用于在检测到服务器启动完成之后,判断服务器GPU当前是否处于模型训练状态之前,对服务器运行环境进行检测,得到检测结果;
信息输出模块,用于当根据所述检测结果确定服务器驱动和工具版本有误时,输出安装正确服务器驱动和工具版本的提示信息。
6.根据权利要求5所述的服务器GPU性能调控装置,其特征在于,还包括:
信息获取模块,用于获取调控效果信息;
显示模块,用于对所述调控效果信息进行显示操作。
7.一种服务器GPU性能调控设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述服务器GPU性能调控方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述服务器GPU性能调控方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东浪潮大数据研究有限公司,未经广东浪潮大数据研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910656862.2/1.html,转载请声明来源钻瓜专利网。