[发明专利]用于避免大数据存储系统进入访问失衡状态的方法及系统有效
申请号: | 201811006479.4 | 申请日: | 2018-08-30 |
公开(公告)号: | CN109240988B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 麦乐峰(厦门)智能科技有限公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/2458 |
代理公司: | 深圳立专知识产权代理有限公司 441000 | 代理人: | 单天禹 |
地址: | 361001 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于避免大数据存储系统进入访问失衡状态的方法及系统,其中方法包括:根据每个存储设备中存储的多个数据项的经过统计的访问信息确定每个存储设备的访问信息统计文件;计算大数据存储系统内低频存储设备的平衡系数;当大数据存储系统内低频存储设备的平衡系数大于平衡预警阈值时,从大数据存储系统内所有低频存储设备中确定选定组合的低频存储设备和多元组合的低频存储设备,针对于多个选定组合的低频存储设备中的每个选定组合的低频存储设备进行处理,或针对于多个多元组合的低频存储设备中的每个多元组合的低频存储设备进行处理,以避免大数据存储系统进入访问失衡状态。 | ||
搜索关键词: | 用于 避免 数据 存储系统 进入 访问 失衡 状态 方法 系统 | ||
【主权项】:
1.一种用于避免大数据存储系统进入访问失衡状态的方法,所述方法包括:基于当前的统计时间区间和大数据存储系统内多个存储设备中每个存储设备的运行日志文件确定每个存储设备中存储的多个数据项的经过统计的访问信息,根据每个存储设备中存储的多个数据项的经过统计的访问信息确定每个存储设备的访问信息统计文件;其中所述访问信息统计文件包括数据项统计表,所述数据项统计表包括多个数据项记录,其中每个数据项记录的内容为6元组<数据项的标识符、被访问次数、统计起始时间、统计结束时间、存储尺寸、存储起始时间>;对每个存储设备的访问信息统计文件进行解析,将当前的统计时间区间内每个存储设备的所有数据项中被访问次数小于低频次数阈值Lthreshod的数据项确定为低频数据项,确定每个存储设备所包括的低频数据项的低频项数量;将多个存储设备中低频项数量大于低频设备阈值的存储设备确定为低频存储设备并确定大数据存储系统中低频存储设备的数量;基于每个低频存储设备的访问信息统计文件,确定每个低频存储设备的每个低频数据项的存储尺寸和被访问次数并且确定每个低频存储设备的低频数据项的低频项数量,基于每个低频存储设备的访问信息统计文件确定每个低频存储设备各自的所有数据项的总被访问次数;根据每个低频存储设备的标识符和大数据存储系统的系统记录设备中的设备描述信息确定每个低频存储设备各自的总存储容量,和根据大数据存储系统的系统记录设备中的设备描述信息大数据存储系统中所有存储设备的总数量,计算大数据存储系统内低频存储设备的平衡系数:其中α>0,β>0,χ>0并且α+β+χ=1其中,DLB是大数据存储系统内低频存储设备的平衡系数;LTNi为第i个低频存储设备的低频数据项的低频项数量,LDN为大数据存储系统中低频存储设备的数量;LTSij为第i个低频存储设备内第j个低频数据项的存储尺寸,LSi为第i个低频存储设备的所有低频数据项的总存储尺寸,LCi为第i个低频存储设备的总存储容量,LTAij为第i个低频存储设备内第j个低频数据项的被访问次数,LAi为第i个低频存储设备的所有低频数据项的总被访问次数,LTi第i个低频存储设备的所有数据项的总被访问次数;Dtotal为大数据存储系统中所有存储设备的总数量;其中i为自然数,LDN≥i≥1并且j为自然数,LTNi≥j≥1,其中LDN≥100,并且LTNi≥100;当大数据存储系统内低频存储设备的平衡系数大于平衡预警阈值时,确定每个低频存储设备中所有数据项的平均被访问次数Lavgi,计算每个低频存储设备的平均被访问次数Lavgi与低频次数阈值Lthreshod的比值Ri;其中LDN≥i≥1,将大数据存储系统内所有低频存储设备中Ri大于1.2的低频存储设备确定为选定组合的低频存储设备,将大数据存储系统内所有低频存储设备中Ri小于或等于1.2的低频存储设备确定为多元组合的低频存储设备,针对于多个选定组合的低频存储设备中的每个选定组合的低频存储设备进行处理,以避免大数据存储系统进入访问失衡状态:将所有数据项中被访问次数大于低频次数阈值Lthreshod×1.5的数据项确定为待选数据项以获得多个待选数据项并由多个待选数据项构成待选数据项集合,确定所有数据项中被访问次数小于低频次数阈值Lthreshod的多个低频数据项,按照被访问次数的升序顺序将多个低频数据项进行排序以生成第一排序列表,将第一排序列表中排序为第1位的低频数据项作为当前低频数据项,1.1、基于当前低频数据项的摘要信息与待选数据项集合中每个待选数据项的摘要信息进行内容匹配,以确定当前低频数据项与每个待选数据项的匹配度;1.2、将所有待选数据项中与当前低频数据项的匹配度最大的待选数据项和当前低频数据项进行数据项组合,以形成一个新的数据项,将新的数据项保存到空闲存储空间中;1.3、从所述待选数据项集合中删除与当前低频数据项的匹配度最大的待选数据项;1.4、确定所述第一排序列表中是否存在排序在当前低频数据项后1位的低频数据项,如果存在,则进行步骤1.5;如果不存在,则结束;1.5、将所述第一排序列表中排序在当前低频数据项后1位的低频数据项选择作为当前低频数据项,进行步骤1.1;针对于多个多元组合的低频存储设备中的每个多元组合的低频存储设备进行处理,以避免大数据存储系统进入访问失衡状态:确定所有数据项中被访问次数小于低频次数阈值Lthreshod的多个低频数据项并且确定低频数据项的低频项数量Z,按照被访问次数的升序顺序将所有低频数据项进行排序以生成第二排序列表,从第二排序列表中排序为第1位的低频数据项开始并且按照升序顺序从第二排序列表中选择Y个低频数据项,其中Y MOD 3=0,并且0≤Z‑Y<3;按照低频数据项的被访问次数将所述Y个低频数据项分成第一预选数据项组、第二预选数据项组和第三预选数据项组,其中第一预选数据项组、第二预选数据项组和第三预选数据项组所包括的低频数据项的数量均相同,并且第一预选数据项组中被访问次数最少的低频数据项的被访问次数大于或等于第二预选数据项组中任意低频数据项的被访问次数,第二预选数据项组中被访问次数最少的低频数据项的被访问次数大于或等于第三预选数据项组中任意低频数据项的被访问次数;2.1、从第一预选数据项组、第二预选数据项组和第三预选数据项组中分别挑选一个低频数据项,将所挑选的三个低频数据项组成一个新的数据项,将新的数据项保存到空闲存储空间中;2.2、在第一预选数据项组、第二预选数据项组和第三预选数据项组中分别删除在步骤2.1中所挑选的一个低频数据项;2.3、确定第一预选数据项组、第二预选数据项组和第三预选数据项组是否均包括低频数据项?如果是,则进行步骤2.1;如果否,则结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于麦乐峰(厦门)智能科技有限公司,未经麦乐峰(厦门)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811006479.4/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置