[发明专利]一种大数据系统的负载均衡方法在审
申请号: | 201811489449.3 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109379298A | 公开(公告)日: | 2019-02-22 |
发明(设计)人: | 徐静;刘劲松;饶江;王友柱 | 申请(专利权)人: | 江苏华生基因数据科技股份有限公司 |
主分类号: | H04L12/801 | 分类号: | H04L12/801;H04L12/803;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 224007 江苏省盐城市经*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据节点 数据单元 总数据量 读取 负载均衡 节点负载 大数据 数据量 更新 存储 管理服务器 资源利用率 负载指数 计算负载 平衡系统 数据操作 记录 统计 | ||
1.一种大数据系统的负载均衡方法,其特征在于,包括以下步骤:
(1)数据节点记录其存储的每个数据单元在每次数据操作中被读取的数据量或被更新的数据量;
(2)数据节点统计一天内每个数据单元的读取总数据量和更新总数据量;
(3)基于所述读取总数据量和更新总数据量为每个数据单元计算负载指数;
(4)数据节点计算其存储的所有数据单元的负载指数之和,作为该数据节点的节点负载指数;
(5)数据节点将其计算得到的节点负载指数发送给管理服务器;
(6)管理服务器基于各个数据节点的节点负载指数,控制各个数据节点进行负载均衡;
其中,所述步骤3中,计算一个数据单元的负载指数F的方法如下:
(3.1)当该数据单元被存储到数据节点中时,设置其初始的负载指数F=0;
(3.2)在获得该数据单元新的一天的读取总数据量R1和更新总数据量R2后,计算新的负载指数Fnew,即:
Fnew=FS+W1R1+W2R2
其中,W1和W2是预先定义的权重值,S是预先定义的衰减指数,0<S<1;
(3.3)将该数据单元的负载指数F更新为Fnew。
2.根据权利要求1所述的方法,其特征在于,所述步骤6具体包括:
(6.1)设共有n个数据节点,其相应的节点负载指数为F1,F2,……,Fn管理服务器计算上述n个节点负载指数的平均值Fave;
(6.2)管理服务器计算各节点负载指数与所述平均值的差,即Di=Fi–Fave(1≤i≤n);
(6.3)对于计算得到的n个Di,若某个Di大于预定义的阈值,则将其对应的数据节点加入待均衡节点集合;
(6.4)所述管理服务器向待均衡节点集合中的每个数据节点发出一个准备均衡的命令消息,所述命令消息中包括了上述平均值Fave;
(6.5)接收到所述命令消息的数据节点计算其节点负载指数与所述平均值的差,并从其存储的数据单元中选择一个负载指数最接近所述差的数据单元,将所选择的数据单元的负载指数通知管理服务器;
(6.6)所述管理服务器按照接收到的负载指数从大到小的顺序,对待均衡节点集合中的各个数据节点排序,设排序后的各个数据节点为A1,A2,……,Am;
(6.7)所述管理服务器按照节点负载指数从小到大的顺序,对相应的数据节点进行排序,取前m个数据节点,设为B1,B2,……,Bm;
(6.8)所述管理服务器向数据节点Aj发出负载均衡消息,所述负载均衡消息中包括了数据节点Bj的地址(1≤j≤m);
(6.9)数据节点Aj将其所选择的数据单元迁移到数据节点Bj,之后Aj删除其存储的该数据单元。
3.根据权利要求1-2任意一项所述的方法,其特征在于,所述步骤2中,每个数据节点在指定时刻进行所述统计。
4.根据权利要求3所述的方法,其特征在于,所述时刻为每天零点。
5.根据权利要求1-4任意一项所述的方法,其特征在于,在数据单元的整个生命周期中,都关联到其相应的负载指数,一旦该数据单元被删除,该负载指数也被删除。
6.根据权利要求2所述的方法,其特征在于,所述步骤6.3中,若所述待均衡节点集合为空集,则方法结束。
7.根据权利要求2所述的方法,其特征在于,在Aj获得Bj的地址后,其与Bj建立连接,将所选择的数据单元发送到Bj存储,之后删除其自身存储的该数据单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏华生基因数据科技股份有限公司,未经江苏华生基因数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811489449.3/1.html,转载请声明来源钻瓜专利网。