[发明专利]一种功耗调控方法、装置、设备及可读存储介质有效
申请号: | 202010956191.4 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112114650B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 林楷智;杨洋 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F1/3234 | 分类号: | G06F1/3234;G06F1/3206;G06F11/30;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 功耗 调控 方法 装置 设备 可读 存储 介质 | ||
1.一种功耗调控方法,其特征在于,包括:
若AI计算节点的节点功耗值大于警戒功耗值,则利用BMC获取所述AI计算节点中的各个计算芯片的芯片功耗值;
根据各个计算芯片的芯片功耗值对各个计算芯片进行分组,获得分组结果;
若所述节点功耗值大于封顶功耗值,则查询所述分组结果对应的功耗调控策略,并按照所述功耗调控策略调整各个计算芯片的功耗限制值,以使所有功耗限制值之和处于目标范围;所述警戒功耗值小于所述封顶功耗值;所述功耗调控策略基于所述目标范围预先设定,所述目标范围用于调控所述AI计算节点中的各个计算芯片的能效值;
其中,所述目标范围的确定过程包括:
利用性能基准测试工具获取所述AI计算节点中的任一个计算芯片在不同芯片功耗值下的各个能效值;所述AI计算节点中的各个计算芯片完全相同;
计算各个能效值与TDP能效值的比值;
将大于预设阈值的比值对应的能效值添加至能效调控区间,将所述能效调控区间对应的各个芯片功耗值确定为所述目标范围。
2.根据权利要求1所述的功耗调控方法,其特征在于,所述利用BMC获取所述AI计算节点中的各个计算芯片的芯片功耗值之前,还包括:
利用所述BMC实时监控所述节点功耗值,若所述节点功耗值大于所述警戒功耗值,则开启功耗调控功能。
3.根据权利要求2所述的功耗调控方法,其特征在于,所述利用所述BMC实时监控所述节点功耗值,包括:
控制所述BMC通过PMBUS总线监控所述节点功耗值。
4.根据权利要求1所述的功耗调控方法,其特征在于,所述利用BMC获取所述AI计算节点中的各个计算芯片的芯片功耗值,包括:
利用所述BMC读所述AI计算节点中的各个计算芯片的电流值,以获得相应芯片功耗值。
5.根据权利要求1所述的功耗调控方法,其特征在于,所述根据各个计算芯片的芯片功耗值对各个计算芯片进行分组,获得分组结果,包括:
按照获取到的分组指令对各个计算芯片进行分组,获得所述分组结果;
或
获取所述目标范围中的最优功耗值,将大于所述最优功耗值的计算芯片划分至第一组,将不大于所述最优功耗值的计算芯片划分至第二组,将所述第一组和所述第二组作为所述分组结果;
或
获取所述目标范围中的最优功耗值,以所述最优功耗值为中值确定缓冲区间,将不属于所述缓冲区间且大于所述最优功耗值的计算芯片划分至第一组,将不属于所述缓冲区间且不大于所述最优功耗值的计算芯片划分至第二组;
计算所述第一组对应的第一功耗梯度,所述第二组对应的第二功耗梯度,以及属于所述缓冲区间中的每个计算芯片对应的芯片功耗梯度;
计算任一个芯片功耗梯度与所述第一功耗梯度的第一相似度,与所述第二功耗梯度的第二相似度,若所述第一相似度大于所述第二相似度,则将所述芯片功耗梯度对应的计算芯片添加至所述第一组,若所述第一相似度小于所述第二相似度,则将所述芯片功耗梯度对应的计算芯片添加至所述第二组,将所述第一组和所述第二组作为所述分组结果。
6.根据权利要求1至5任一项所述的功耗调控方法,其特征在于,所述计算芯片为GPU、NPU、FPGA或ASIC。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010956191.4/1.html,转载请声明来源钻瓜专利网。