[发明专利]一种通过调节GPU频率来降低GPU故障率的方法无效
申请号: | 200910227186.3 | 申请日: | 2009-12-11 |
公开(公告)号: | CN101719084A | 公开(公告)日: | 2010-06-02 |
发明(设计)人: | 徐炜遐;杨灿群;陈娟;杜云飞;易会战;王锋;黄春;赵克佳 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F11/00 | 分类号: | G06F11/00 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
地址: | 410073 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种通过调节GPU频率来降低GPU故障率的方法,目的是降低GPU故障率。技术方案是对GPU建立GPU频率级别表,表项包括GPU核心频率、GPU显存频率、平均无故障时间、GPU温度阈值;由GPU实时温度监控器跟踪并记录用户程序运行过程中GPU温度变化情况,每隔固定时间根据当前GPU的平均温度和温度阈值之间的关系判断是否调频,当GPU的温度超过阈值时,将频率降低一级,当GPU温度处在更高级别的温度阈值范围且连续多个时间间隔未进行频率调节时,将频率提升一级。采用本发明可实现对GPU频率的自适应调节,降低GPU故障率,避免因GPU温度超过阈值导致的隐患和过多次的频率调节而导致的GPU不稳定。 | ||
搜索关键词: | 一种 通过 调节 gpu 频率 降低 故障率 方法 | ||
【主权项】:
1.一种通过调节GPU频率来降低GPU故障率的方法,其特征在于包括以下步骤:第一步、构造GPU频率级别表,GPU频率级别表包括M组值,代表GPU有M级可调频的取值,M为正整数,每组值包括四项内容:GPU核心频率fcore(i)、GPU显存频率fmem(i)、平均无故障时间MTBF(i)、GPU温度阈值Tup(i),其中i为GPU频率级别表项的编号,i=1...M;编号数字越高代表GPU频率级别越高,往i递增的方向调节频率级别称为“GPU频率往上调节一级”,反之称为“GPU频率往下调节一级”;第二步、根据用户程序运行要求的平均无故障时间,在GPU频率级别表中选择对应的项I,I为当前选择的频率级别,1≤I≤M,将GPU核心频率设置为GPU频率级别表中第I项对应的GPU核心频率fcore(I),将GPU显存频率设置为GPU频率级别表中第I项对应的GPU显存频率fmem(I),记下GPU频率级别表中第I项对应的GPU温度阈值Tup(I);第三步、启动用户程序运行,同时启动GPU实时温度监控器全程监控并记录GPU温度,采样间隔时间为tinterval;第四步、判断用户程序是否执行完毕,是,则执行第十一步;否则执行第五步;第五步、每隔时间tinterval对GPU温度进行统计,将tinterval时间内的GPU温度平均值记为
第六步、如果满足
(I),说明当前GPU的温度并没有超过当前频率级别的温度阈值,执行第八步;否则,执行第七步;第七步、此时满足
(I),说明GPU的温度已超过当前频率级别的温度阈值,需启动频率调节方案,将GPU频率往下调低一级,同时将处理结果记录在日志文件中,具体步骤如下:7.1在日志文件中添加一项,包括当前系统时间、当前GPU核心频率、GPU显存频率、前一个tinterval时间内的GPU温度平均值
和调频情况,前四项内容此时填写,调频情况在调频后填写;7.2如果I为最低级别,执行步骤7.5;否则,执行步骤7.3;7.3将当前的频率级别I减1,即I=I-1;7.4如果
(I),则确定当前频率级别为I,将GPU核心频率和GPU显存频率分别调节至fcore(I)、fmem(I),在日志文件的当前项的调频情况一项中填写“频率成功降低一级”,执行第四步;7.5在日志文件的当前项的调频情况一项中填写“当前已为最低频率级别,无需调频”,执行第四步;第八步、如果I不是最高级别,满足
(I+1)且已有连续L个tinterval时间内未发生频率调节,说明当前GPU频率可调节至I+1级,执行第九步;否则执行第十步;第九步、启动频率调节方案,将GPU频率往上调高一级,同时将处理结果记录在日志文件中,具体步骤如下:9.1将当前的频率级别I增1,即I=I+1;9.2确定当前频率级别为I,将GPU核心频率和GPU显存频率分别调节至fcore(I)、fmem(I);9.3在日志文件中添加一项,包括当前系统时间、当前GPU核心频率、GPU显存频率、前一个tintral时间内的GPU温度平均值
和调频情况,调频情况一项中填写“频率成功增高一级”,执行第四步;第十步、保持当前GPU核心频率和GPU显存频率不变,在日志文件中添加一项,包括当前系统时间、当前GPU核心频率、GPU显存频率、前一个tinterval时间内的GPU温度平均值
和调频情况,在调频情况一项中填写“未调频”,执行第四步;第十一步、本次调频结束,等待下一个用户程序运行,实施同样的GPU调频过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910227186.3/,转载请声明来源钻瓜专利网。