[发明专利]多机系统、用于优化多机系统功耗的方法及装置有效

专利信息
申请号: 201310001368.5 申请日: 2013-01-04
公开(公告)号: CN103914121B 公开(公告)日: 2017-04-19
发明(设计)人: 张帅;宋风龙;王达;张浩 申请(专利权)人: 华为技术有限公司;中国科学院计算技术研究所
主分类号: G06F1/32 分类号: G06F1/32
代理公司: 北京同立钧成知识产权代理有限公司11205 代理人: 刘芳
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 系统 用于 优化 功耗 方法 装置
【说明书】:

技术领域

发明涉及计算机节能技术,尤其涉及一种多机系统、用于优化多机系统功耗的方法及装置。

背景技术

处理器功耗管理技术是近年来处理器设计的重要课题。随着深亚微米工艺的进步,漏电功耗已经成为处理器功耗的组成部分。因此,一系列针对减少处理器漏电功耗(静态功耗)的技术相继诞生。

首先被广泛用于减少处理器漏电功耗的方法是动态功耗管理技术(Dynamic Power Management,DPM)。DPM先通过关闭空闲的处理器或处理器核来减少不必要的功耗开销,然后通过任务迁移并关闭负载较低的处理器或处理器核的方法来减少功耗。

其次,随着动态电压频率缩放技术(Dynamic Voltage and Frequency Scaling,DVFS)的广泛应用,将DVFS与前述DPM相结合,在关闭负载较低的处理器或处理器核的同时,提高其他工作核的电压频率,可以做到既节约功耗又保证性能不受损失。

但是,在保证性能的前提下,并不是频率越高核数越少就能获得较低功耗。

一方面,频率提高会导致功耗的超线性增长,因此当由频率增加导致的动态功耗增加大于由关闭处理器核带来的静态功耗降低时,处理器的总功耗就会增加;另一方面,对于并行性高的程序可以通过增加执行核数并降低频率来保证性能,但核数增加带来的静态功耗增加大于由频率降低带来的动态功耗降低时,处理器的总功耗也会增大。因此在保证性能不变的前提下,使用DVFS的同时调整处理器的执行核数,功耗会随核数的增加出现先降低后增加的变化趋势。

上述规律对于多核乃至众核处理器上运行大规模多线程程序的情况来说,如何在一定性能约束下寻找不同程序的最优执行核数的频率,成为功耗优化管理的最终目标。

目前,涡轮加速器(Turbo boost)技术是英特尔(Intel)主流处理器中使用的一种功耗管理方法。该技术通过底层硬件进行处理器核的频率调节,能够对指定的单一核进行频率操作,同时其余的空负载处理器核进入深度睡眠状态,以达到功耗与性能间的平衡。

但是,Turbo boost技术主要应用于小于或等于8个核的处理器上,面向的主流处理器的核数较少,当处理器核数规模大于目前的核数时,使用Turbo boost技术关闭负载低的核并提升负载高的核频率,极有可能出现功耗随核数的增加出现先降低再增加的情况。并且,该技术针对的应用程序并行度有限,导致线程数通常小于处理器核数,此时关闭空闲的处理器核虽然可以降低静态功耗,但是当程序线程数大于处理器核数时,关闭一部分处理器核可能导致其他处理器核的负载增加,从而无法保证目标性能或者导致功耗增大。

另外一种功耗管理方法是在功耗-核数空间上,使用爬山法搜索最低功耗所需核数。该方法以某一核数a作为试验点,测得功耗值,然后在a+1个处理器核上执行,如果功耗大于a个核上测得的功耗值,则下一次试验点为a-1个核;若功耗小于a个核上测得的功耗,则下一次试验点的核数为a+2,依次在核数为a的两侧循环执行,并测得相应的功耗,从中找到最低功耗对应的处理器核数。

这种方法的缺点是试验点向最低功耗所在核数逼近的速度较慢,每次试验点都比上一次增加或减少一个核数。随着处理器规模的增大,爬山法搜索遍历的试验次数也会大大增加,得到最优解的速度较慢。因此该方法的可扩展性比较差,不能迅速逼近功耗最优值。

发明内容

本发明实施例提供一种多机系统、用于优化多机系统功耗的方法及装置,用于提高多机系统的功耗优化效率。

第一个方面,本发明实施例提供一种用于优化多机系统功耗的方法,包括:

确定多机系统中用于调整所述多机系统功耗的数据处理设备的数量范围,所述数量范围的最小值为下界,最大值为上界;

在所述数量范围内进行搜索,确定第一试验点和第二试验点;所述第一试验点、第二试验点均为数据处理设备的数量,且所述第一试验点与所述第二试验点之和等于所述上界与所述下界之和;

根据所述第一试验点和第二试验点关闭所有非执行数据处理设备,并逐步降低剩余数据处理设备的频率,以满足目标性能。

第二个方面,本发明实施例提供一种用于优化多机系统功耗的装置,包括:

范围确定单元,用于确定多机系统中用于调整所述多机系统功耗的数据处理设备的数量范围,所述数量范围的最小值为下界,最大值为上界;

试验点确定单元,用于在所述数量范围内进行搜索,确定第一试验点和第二试验点;所述第一试验点、第二试验点均为数据处理设备的数量,且所述第一试验点与所述第二试验点之和等于所述上界与所述下界之和;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;中国科学院计算技术研究所,未经华为技术有限公司;中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310001368.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top