[发明专利]一种处理器动态控制方法、电子设备和存储介质在审
申请号: | 202111288651.1 | 申请日: | 2021-11-02 |
公开(公告)号: | CN113946428A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 彭嘉乔 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 吴晓霞 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理器 动态控制 方法 电子设备 存储 介质 | ||
1.一种处理器动态控制方法,其特征在于,包括:
根据处理器的当前状态信息查找Q值表获取控制动作;
根据所述控制动作对应的处理器运行参数调整所述处理器;
其中,所述Q值表根据Q-learning算法预先建立,所述Q值表对应的状态集为根据处理器状态信息划分的多种状态的集合,所述Q值表对应的动作集为将处理器的运行参数调整为不同目标运行参数的多种调整动作的集合。
2.如权利要求1所述的方法,其特征在于,
所述状态信息包括:第一时长内活跃的处理器时钟周期数量;
所述Q值表对应的状态集中的多个状态分别对应于多个第一时长内活跃的处理器时钟周期数量区间。
3.如权利要求1所述的方法,其特征在于,
所述状态信息包括:第一时长内活跃的处理器时钟周期数量和第一时长内系统任务松弛度;
所述Q值表对应的状态集中的多个状态分别对应于第一时长内活跃的处理器时钟周期数量区间和第一时长内系统任务松弛度区间的多种组合。
4.如权利要求1-3任一项所述的方法,其特征在于,
所述根据处理器的当前状态信息查找Q值表获取控制动作,包括:
根据所述当前状态信息确定对应在所述Q值表的状态集中的状态;
根据所确定的状态查找所述Q值表获取最大Q值对应的动作作为所述控制动作。
5.如权利要求1-3任一项所述的方法,其特征在于,
所述方法还包括:
在满足更新条件的情况下,根据以下方法执行Q值更新算法更新所述Q值表:
确定第二时长内活跃的处理器时钟周期数量的统计值;
根据所述统计值确定对应在所述Q值表的状态集中的状态;
根据所述状态和所述Q值表,采用∈-greedy算法确定开发或探索对应的动作;
执行所述开发或探索对应的动作,调整所述处理器的运行参数,并获得环境奖励;
根据所述环境奖励更新所述Q值表。
6.如权利要求5所述的方法,其特征在于,
所述确定第二时长内活跃的处理器时钟周期数量的统计值,包括:
根据以下方式确定所述统计值:
其中,为第t个统计周期内活跃的处理器时钟周期数量的平均数,ct为第t个统计周期内最后一个第一时长内活跃的处理器时钟周期数量,为所述统计值,β为加权系数,一个统计周期的时长为第二时长,所述第二时长大于或等于所述第一时长。
7.如权利要求5所述的方法,其特征在于,
所述环境奖励rt根据以下公式计算:
rt=k(|Lt+1|-|Lt|)
其中,k为常数,rt为第t个统计周期的环境奖励,Lt表示第t个统计周期内系统任务松弛度,Lt+1表示第t+1个统计周期内系统任务松弛度;一个统计周期的时长为第二时长,所述第二时长大于或等于所述第一时长;
或者,
所述环境奖励rt根据以下公式计算:
rt=m(Loadt+1-Loadt)
其中,m为常数,rt为第t个统计周期的环境奖励,Loadt表示第t个统计周期内系统负载百分比,Loadt+1表示第t+1个统计周期内系统负载百分比。
8.如权利要求1-3任一项所述的方法,其特征在于,
所述处理器的运行参数包括:电压和/或频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111288651.1/1.html,转载请声明来源钻瓜专利网。