[发明专利]功率参数的调整方法、装置及强化学习模型训练方法有效
申请号: | 201811419611.4 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109491494B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 李江涛;侯鹏飞 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G06F1/3206 | 分类号: | G06F1/3206;G06F1/3234;G06N3/063 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 孟潭 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 功率 参数 调整 方法 装置 强化 学习 模型 训练 | ||
1.一种功率参数的调整方法,包括:
确定神经网络处理器在运行时的状态参数和第一功率参数;
根据所述状态参数和所述第一功率参数确定所述神经网络处理器的第二功率参数;以及
将所述神经网络处理器的功率参数由所述第一功率参数调整到所述第二功率参数;
其中,根据所述状态参数和所述第一功率参数确定所述神经网络处理器的第二功率参数的具体方法包括:
将所述状态参数和所述第一功率参数输入已训练的强化学习模型;
通过所述强化学习模型计算所述神经网络处理器的所有功率参数所对应的至少一个收益价值;其中,所述收益价值是与所述神经网络处理器运行时的能耗所对应的一个表征值,用于代表所述神经网络处理器运行所浪费的能耗值,所述收益价值与能耗值负相关;
从所述至少一个收益价值中确定最高的收益价值;以及
将所述最高的收益价值对应的功率参数确定为所述神经网络处理器的第二功率参数。
2.根据权利要求1所述的方法,其中,所述方法还包括:
将所述神经网络处理器的状态参数和功率参数传送至训练模块,以供所述训练模块训练所述强化学习模型。
3.根据权利要求1所述的方法,其中,所述确定神经网络处理器在运行时的状态参数,包括:
确定所述神经网络处理器在运行时需要处理的数据类型;以及
基于所述数据类型确定所述神经网络处理器的状态参数。
4.一种应用于功率参数调整的强化学习模型的训练方法,包括:
获取神经网络处理器运行时的状态参数和功率参数,其中,所述状态参数和所述功率参数由协处理器获取,所述状态参数基于预设负载状态参数产生;
计算所述状态参数和所述功率参数所代表的收益价值;其中,所述收益价值是与所述神经网络处理器运行时的能耗所对应的一个表征值,用于代表所述神经网络处理器运行所浪费的能耗值;
将所述状态参数、功率参数及对应的所述收益价值作为经验样本存入所述强化学习模型的经验池中;
更新所述功率参数,其中,所述功率参数的更新范围为给定的多个功率参数;以及
当所述给定的多个功率参数都具有对应的收益价值时,停止训练所述强化学习模型。
5.根据权利要求4所述的方法,其中,所述方法还包括:
将给定的所述预设负载状态参数通过排列组合的方式获取组合负载状态参数;
获取基于所述组合负载状态参数产生的所述状态参数;以及
基于所产生的所述状态参数对所述强化学习模型进行训练。
6.根据权利要求4或5所述的方法,其中,所述计算所述状态参数和所述功率参数所代表的收益价值,包括:
根据所述状态参数和处理负载所需要的最小状态参数的差值、所述功率参数计算所述收益价值,其中,所述差值与所述收益价值负相关,所述功率参数与所述收益价值负相关。
7.根据权利要求6所述的方法,其中,所述计算所述状态参数和所述功率参数所代表的收益价值,还包括:
对所述差值进行加权处理,和/或,对所述功率参数进行加权处理;以及
根据加权处理后的所述差值和/或加权处理后的所述功率参数计算所述收益价值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811419611.4/1.html,转载请声明来源钻瓜专利网。