[发明专利]用于避免大数据存储系统进入访问失衡状态的方法及系统有效

专利信息
申请号: 201811006479.4 申请日: 2018-08-30
公开(公告)号: CN109240988B 公开(公告)日: 2023-08-15
发明(设计)人: 请求不公布姓名 申请(专利权)人: 麦乐峰(厦门)智能科技有限公司
主分类号: G06F16/13 分类号: G06F16/13;G06F16/2458
代理公司: 深圳立专知识产权代理有限公司 441000 代理人: 单天禹
地址: 361001 福建省厦门*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种用于避免大数据存储系统进入访问失衡状态的方法及系统,其中方法包括:根据每个存储设备中存储的多个数据项的经过统计的访问信息确定每个存储设备的访问信息统计文件;计算大数据存储系统内低频存储设备的平衡系数;当大数据存储系统内低频存储设备的平衡系数大于平衡预警阈值时,从大数据存储系统内所有低频存储设备中确定选定组合的低频存储设备和多元组合的低频存储设备,针对于多个选定组合的低频存储设备中的每个选定组合的低频存储设备进行处理,或针对于多个多元组合的低频存储设备中的每个多元组合的低频存储设备进行处理,以避免大数据存储系统进入访问失衡状态。
搜索关键词: 用于 避免 数据 存储系统 进入 访问 失衡 状态 方法 系统
【主权项】:
1.一种用于避免大数据存储系统进入访问失衡状态的方法,所述方法包括:基于当前的统计时间区间和大数据存储系统内多个存储设备中每个存储设备的运行日志文件确定每个存储设备中存储的多个数据项的经过统计的访问信息,根据每个存储设备中存储的多个数据项的经过统计的访问信息确定每个存储设备的访问信息统计文件;其中所述访问信息统计文件包括数据项统计表,所述数据项统计表包括多个数据项记录,其中每个数据项记录的内容为6元组<数据项的标识符、被访问次数、统计起始时间、统计结束时间、存储尺寸、存储起始时间>;对每个存储设备的访问信息统计文件进行解析,将当前的统计时间区间内每个存储设备的所有数据项中被访问次数小于低频次数阈值Lthreshod的数据项确定为低频数据项,确定每个存储设备所包括的低频数据项的低频项数量;将多个存储设备中低频项数量大于低频设备阈值的存储设备确定为低频存储设备并确定大数据存储系统中低频存储设备的数量;基于每个低频存储设备的访问信息统计文件,确定每个低频存储设备的每个低频数据项的存储尺寸和被访问次数并且确定每个低频存储设备的低频数据项的低频项数量,基于每个低频存储设备的访问信息统计文件确定每个低频存储设备各自的所有数据项的总被访问次数;根据每个低频存储设备的标识符和大数据存储系统的系统记录设备中的设备描述信息确定每个低频存储设备各自的总存储容量,和根据大数据存储系统的系统记录设备中的设备描述信息大数据存储系统中所有存储设备的总数量,计算大数据存储系统内低频存储设备的平衡系数:其中α>0,β>0,χ>0并且α+β+χ=1其中,DLB是大数据存储系统内低频存储设备的平衡系数;LTNi为第i个低频存储设备的低频数据项的低频项数量,LDN为大数据存储系统中低频存储设备的数量;LTSij为第i个低频存储设备内第j个低频数据项的存储尺寸,LSi为第i个低频存储设备的所有低频数据项的总存储尺寸,LCi为第i个低频存储设备的总存储容量,LTAij为第i个低频存储设备内第j个低频数据项的被访问次数,LAi为第i个低频存储设备的所有低频数据项的总被访问次数,LTi第i个低频存储设备的所有数据项的总被访问次数;Dtotal为大数据存储系统中所有存储设备的总数量;其中i为自然数,LDN≥i≥1并且j为自然数,LTNi≥j≥1,其中LDN≥100,并且LTNi≥100;当大数据存储系统内低频存储设备的平衡系数大于平衡预警阈值时,确定每个低频存储设备中所有数据项的平均被访问次数Lavgi,计算每个低频存储设备的平均被访问次数Lavgi与低频次数阈值Lthreshod的比值Ri;其中LDN≥i≥1,将大数据存储系统内所有低频存储设备中Ri大于1.2的低频存储设备确定为选定组合的低频存储设备,将大数据存储系统内所有低频存储设备中Ri小于或等于1.2的低频存储设备确定为多元组合的低频存储设备,针对于多个选定组合的低频存储设备中的每个选定组合的低频存储设备进行处理,以避免大数据存储系统进入访问失衡状态:将所有数据项中被访问次数大于低频次数阈值Lthreshod×1.5的数据项确定为待选数据项以获得多个待选数据项并由多个待选数据项构成待选数据项集合,确定所有数据项中被访问次数小于低频次数阈值Lthreshod的多个低频数据项,按照被访问次数的升序顺序将多个低频数据项进行排序以生成第一排序列表,将第一排序列表中排序为第1位的低频数据项作为当前低频数据项,1.1、基于当前低频数据项的摘要信息与待选数据项集合中每个待选数据项的摘要信息进行内容匹配,以确定当前低频数据项与每个待选数据项的匹配度;1.2、将所有待选数据项中与当前低频数据项的匹配度最大的待选数据项和当前低频数据项进行数据项组合,以形成一个新的数据项,将新的数据项保存到空闲存储空间中;1.3、从所述待选数据项集合中删除与当前低频数据项的匹配度最大的待选数据项;1.4、确定所述第一排序列表中是否存在排序在当前低频数据项后1位的低频数据项,如果存在,则进行步骤1.5;如果不存在,则结束;1.5、将所述第一排序列表中排序在当前低频数据项后1位的低频数据项选择作为当前低频数据项,进行步骤1.1;针对于多个多元组合的低频存储设备中的每个多元组合的低频存储设备进行处理,以避免大数据存储系统进入访问失衡状态:确定所有数据项中被访问次数小于低频次数阈值Lthreshod的多个低频数据项并且确定低频数据项的低频项数量Z,按照被访问次数的升序顺序将所有低频数据项进行排序以生成第二排序列表,从第二排序列表中排序为第1位的低频数据项开始并且按照升序顺序从第二排序列表中选择Y个低频数据项,其中Y MOD 3=0,并且0≤Z‑Y<3;按照低频数据项的被访问次数将所述Y个低频数据项分成第一预选数据项组、第二预选数据项组和第三预选数据项组,其中第一预选数据项组、第二预选数据项组和第三预选数据项组所包括的低频数据项的数量均相同,并且第一预选数据项组中被访问次数最少的低频数据项的被访问次数大于或等于第二预选数据项组中任意低频数据项的被访问次数,第二预选数据项组中被访问次数最少的低频数据项的被访问次数大于或等于第三预选数据项组中任意低频数据项的被访问次数;2.1、从第一预选数据项组、第二预选数据项组和第三预选数据项组中分别挑选一个低频数据项,将所挑选的三个低频数据项组成一个新的数据项,将新的数据项保存到空闲存储空间中;2.2、在第一预选数据项组、第二预选数据项组和第三预选数据项组中分别删除在步骤2.1中所挑选的一个低频数据项;2.3、确定第一预选数据项组、第二预选数据项组和第三预选数据项组是否均包括低频数据项?如果是,则进行步骤2.1;如果否,则结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于麦乐峰(厦门)智能科技有限公司,未经麦乐峰(厦门)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811006479.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top