[发明专利]一种提升计算子系统能效的资源分配方法、系统及介质有效
申请号: | 202010290699.5 | 申请日: | 2020-04-14 |
公开(公告)号: | CN111444025B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 陈娟;齐新新;董勇;袁远;吴菲豪;孙晓乐;欧祉辛;张云放 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 谭武艺 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提升 计算 子系统 能效 资源 分配 方法 系统 介质 | ||
1.一种提升计算子系统能效的资源分配方法,其特征在于实施步骤包括:
1)确定最优增加节点数目ΔN*、处理器频率f*以及功耗限制值Ptarget;
2)利用动态处理器频率调节工具,设置功耗限制值为Ptarget,并调度并行程序运行在N+ΔN*个计算节点上,且每一个计算节点的处理器频率的初始值为处理器频率f*,其中N为并行程序运行需要的最少计算节点数,缺省资源分配下每一个处理器核运行一个进程;
步骤1)中确定最优增加节点数目ΔN*的步骤包括:利用总内存带宽计算第一增加节点数据区间[0,ΔNpref];利用功耗约束条件计算第二增加节点数据区间[0,ΔNpower];求第一增加节点数据区间[0,ΔNpref]、第二增加节点数据区间[0,ΔNpower]之间的交集,并选择所求交集区间中的最大值作为最优增加节点数目ΔN*;
步骤1)中确定处理器频率f*的步骤包括:将最优增加节点数目ΔN*代入下式所示的功耗约束函数,令ΔN=ΔN*,令Pcpu(fmid)=Pcpu(fi),得到功耗值Pcpu(fi)的范围,根据不同处理器频率级别及处理器核功耗值之间的关系,取满足条件的处理器频率fi的最大值,将其作为步骤1)中确定的处理器频率f*;
上式中,n为并行程序的进程数,缺省资源分配下每一个处理器核运行一个进程,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗,Pcpu(fi)为单个处理器核运行在fi下对应的处理器功耗,c为每个计算节点上所拥有的处理器核数目,为单个处理器核处于空闲状态下的处理器功耗,Pmem为内存功耗,Pother为单个计算节点上除处理器和内存以外的其他功耗;
步骤1)中确定功耗限制值Ptarget的计算函数表达式如下:
上式中,Pcpu(fmax)为单个处理器核运行在最大频率fmax下对应的处理器功耗。
2.根据权利要求1所述的提升计算子系统能效的资源分配方法,其特征在于,所述利用总内存带宽计算第一增加节点数据区间[0,ΔNpref]的详细步骤包括:
S1)获取记录的各个时刻t各个计算节点上的实际访存带宽b1(t),b2(t),...,bN(t),计算并行程序运行期间的单节点平均实际访存带宽b(t),且取b(t)的最大值作为该并行程序的实际访存带宽BN,其中bi(t)为第i个计算节点上的实际访存带宽值;
S2)计算实际访存带宽BN相对单个节点的物理内存带宽B的比值bound,并根据比值bound是否达到阈值α判断该并行程序是否访存受限,如果非访存受限,则跳转执行步骤S3);如果访存受限,则跳转执行步骤S4);
S3)判定不需要增加节点,设置ΔNpref的数量为0,使得得到的第一增加节点数据区间[0,ΔNpref]为[0,0],结束并返回;
S4)根据总内存带宽不变原则N·((bound/α)·BN)=(N+ΔNpref)·α·B求解得到所需增加的节点数目ΔNpref,得到第一增加节点数据区间[0,ΔNpref],结束并返回。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010290699.5/1.html,转载请声明来源钻瓜专利网。