[发明专利]一种数据中心能效相关特征的选择方法在审
申请号: | 201811469430.2 | 申请日: | 2018-11-28 |
公开(公告)号: | CN110309037A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 李云;张諝晟;沈子钰;夏彬;刘峥 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据中心 能效 特征选择 分类间隔 特征权重 能耗数据 损失函数 噪声数据 分级 排序 样本 分类 预测 更新 学习 | ||
本发明提出了一种数据中心能效相关特征的选择方法,针对数据中心能效的特征选择问题,本发明采用了一种基于K近邻分类损失函数和分类间隔的特征选择方法,该方法通过收集数据中心能耗数据和对应的PUE值,然后将PUE值分级分类,通过样本找到对应的分类间隔,并更新特征权重和对特征权重排序,以此根据设定的阈值获得特征选择结果。本发明所述方法能够提取出与数据中心能效相关的特征并很好地处理噪声数据,从而提高后续能效预测的精度,有效防止过学习。
技术领域
本发明属于云计算和机器学习,具体涉及一种数据中心能效相关特征的选择方法。
背景技术
数据中心是执行全天候大规模关键运算任务的基础设施,是支撑IT行业运转的重要设施。随着网络运营商和互联网公司的大规模云服务对数据计算、处理和存储的需求不断增长,拥有成千上万台服务器的大型数据中心激增。其次,高性能运算的云端化随着网络带宽的扩容而不断发展,这扩大了构建大规模计算基础架构的需求。因此,数据中心成为快速发展的IT行业的关键基础设施之一。
近年来,由于数据中心的高经济效益与环境相关性,数据中心的能源效率的优化问题已经变得至关重要。首先,数据中心带来了许多经济效益,这使得数据中心的规模和数量也不断增长。随着用电量的急剧增加和电力成本的上升,电费已经成为当今数据中心的主要开支。在某些情况下,数据中心的电力成本可能高于原始资本投资的成本。其次,数据中心的能源使用会产生许多环境问题,如大量的电能消耗、空调等制冷设备的温室气体排放与冷却水的排放。而且即使数据中心的服务器处于空闲状态,同样会消耗大量的能量。出于这些原因,目前在数据中心运营过程中其能源效率需要优先考虑。
衡量数据中心能效的最常用指标是能源使用效率,即PUE。这个指标的定义是输入数据中心的总能耗除以IT设备使用的能耗。总能耗包括IT设备使用的能耗加上任何非计算和数据通信用途的设备(即冷却,照明设备等)所消耗的任何开销功耗。若数据中心的PUE值为2.0,这意味着该设施每供给IT设备1瓦特的能耗,其他非IT设备也会消耗1瓦特能耗。最理想的PUE是1.0,即除IT设备外无其他能耗的假设情况。该种情况在实际应用中是无法达到的,所以先进的数据中心都力求PUE趋近于1.0。
基于上述情况,解决数据中心的能效预测问题已经迫在眉睫,此问题成为了国内外的研究热点。而能效预测中的核心任务之一是挑选与数据中心能效相关的关键属性(特征)。目前大多数能效预测研究都是基于极简的数据中心模型来实现的,比如简单的服务器CPU频率或性能计数器指标,因此特征选择比较容易。而对于大规模数据中心,其特征繁多且复杂,相关特征选择的研究比较少,仅有的模型大多都基于深度神经网络的黑盒模型,可解释性差。
发明内容
发明目的:针对上述现有技术对于特征数据的选择性不足,本发明提供一种数据中心能效相关特征的选择方法,能够针对所有数据中心进行相关特征的选择。
技术方案:一种数据中心能效相关特征的选择方法,包括以下步骤:
(1)收集数据中心能耗数据和对应的PUE值;
(2)按分级标准将PUE值分级;
(3)随机选择样本并查找其K近邻,同时计算该样本所对应的分类间隔;
(4)建立基于分类损失-间隔的特征选择评价准则;
(5)通过梯度下降优化所设计的评价准则更新特征权重;
(6)对特征权重排序,并通过设定阈值来获得特征选择结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811469430.2/2.html,转载请声明来源钻瓜专利网。