[发明专利]一种用于数据中心分布式文件存储的节能方法有效
申请号: | 201610016441.X | 申请日: | 2016-01-11 |
公开(公告)号: | CN105681052B | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 杨挺;徐明玉;赵睿;盆海波;尚昆;武金成 | 申请(专利权)人: | 天津大学 |
主分类号: | H04L12/12 | 分类号: | H04L12/12;H04L29/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 数据中心 分布式 文件 存储 节能 方法 | ||
1.一种用于数据中心分布式文件存储的节能方法,其特征在于,所述节能方法包括以下步骤:
基于分布式文件存储的机架感知存储策略,将文件数据块及其副本、与存储的数据节点之间的关系用超图表示出来;
利用超图的关联矩阵清晰地表示超边和节点之间的关系;
提出根据分布式集群文件的访问特点,在满足低时延的应用访问要求前提下,不同文件具有的活跃副本数目
在满足数据块可用的前提下,依据文件被访问的频度,获取可变覆盖横贯模型;
根据可变覆盖的横贯模型确定最大关闭数据节点DataNode数目,实现数据中心分布式文件存储节能;
所述可变覆盖的横贯模型具体为:
或1i=1,2,…,n
其中,表示第si个机架上的第i个服务器的状态;0表示服务器处于休眠状态,1表示服务器处于活跃状态;aij表示节点关联矩阵里的元素;kl为文件的活动系数;Nl为文件l所包含的数据块的个数;为服务器节点的顶点度之和;n表示服务器的个数;m表示超边的个数,即数据块的种类;w表示文件的个数。
2.根据权利要求1所述的一种用于数据中心分布式文件存储的节能方法,其特征在于,所述将文件数据块及其副本、与存储数据的节点之间的关系用超图表示出来具体为:
数据节点DataNode作为超图的顶点,以每种数据块作为超边,数据块和数据节点间复杂的多对多关系通过超图表示出来。
3.根据权利要求1所述的一种用于数据中心分布式文件存储的节能方法,其特征在于,所述活跃副本数目具体为:
处于活跃状态服务器上的数据块副本个数,该参数也是所求的数据节点的子集与每条超边的交点个数。
4.根据权利要求1所述的一种用于数据中心分布式文件存储的节能方法,其特征在于,所述根据可变覆盖的横贯模型确定最大关闭数据节点DataNode数目具体为:
在满足文件的活跃副本数目kl的情况下,使开启服务器的个数最少,即值最小;
当存在开启服务器的个数相同、但不同状态向量解集时,从中选取顶点度之和最小的,即值最小的;
当存在横贯集等秩、且存储的总数据块个数相同的解集时,考虑选择活跃状态服务器分布的机架数量多的解集,即值最大的。
5.根据权利要求1所述的一种用于数据中心分布式文件存储的节能方法,其特征在于,所述节能方法还包括:
1)负载均衡度的评价:负载均衡度表示的是服务器集群中所有服务器负载的总偏差和总负载的比值,根据服务器实际负载与负载平均值差的绝对值表示负载偏差,计算负载均衡度,即其中BL表示HDFS集群的负载均衡度,si表示第i个服务器的负载率,表示平均负载率;2)对分布式文件集群进行节能评价;
一个DataNode节点的功耗为:
Pserver=σe+μesa
式中,σe为空闲功耗或者静态功耗,s为服务器的负载率,与服务器的时钟频率成正比,μe和a为常数;
整个HDFS集群节约的功耗为:
其中,s1为进行节能处理前的服务器的负载率,s2为进行节能处理后处于活跃状态的服务器的负载率,一般情况下有s1<s2;n为HDFS集群中DataNode的个数;q为休眠的DataNode的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610016441.X/1.html,转载请声明来源钻瓜专利网。