[发明专利]一种分布式存储系统中海量数据的冷热判断方法在审
申请号: | 201811594303.5 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109783443A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 张兴军;刘威;董小社;武旭瑞;赵英交;刘云飞 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/17;G06F16/182 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分布式存储系统中数据冷热的判断方法,采用多版本的哈希表来统计数据的访问频度,并据此确定数据的冷热状况。该方法主要包括:选取合适数量的哈希函数,并在每次数据访问时将访问的索引通过这些哈希函数计算出对应的哈希结果,然后增加这些哈希结果在当前版本哈希表中对应位置的值;经过多次访问后,通过切换当前版本的哈希表以及移除所有版本哈希表的首位来进行衰减,以降低老旧信息的影响;最后通过统计所有版本哈希表中的数据访问信息来确定数据的冷热。相对于该领域其他方法,该方法可以在使用相同大小的内存空间时,提供更高的冷热数据判断准确率,有利于冷热数据的分别处理,从而提高系统性能。 | ||
搜索关键词: | 冷热 哈希表 分布式存储系统 哈希函数 哈希结果 数据访问信息 访问频度 内存空间 数据访问 数据判断 统计数据 系统性能 准确率 衰减 索引 移除 访问 统计 | ||
【主权项】:
1.一种分布式存储系统中海量数据的冷热判断方法,其特征在于,包括以下步骤:步骤1,构建一个分布式存储系统,并确定该分布式系统的数据访问方式;步骤2,在内存中申请一段连续空间作为散列表,用以记录该分布式系统的数据访问情况,一共采用V个散列表,其中负责记录当前数据访问信息的散列表CHT共有M位,每一位大小都为Vbits,占用的空间大小为M×V bits;步骤3,选取K个均匀的哈希函数为Data ID进行散列;步骤4,将步骤3中的哈希结果映射到当前版本散列表的对应位置上,用于统计映射到这一位的数据被访问的总次数;步骤5,经过访问周期T后,执行散列表切换;步骤6,进行数据冷热判断。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811594303.5/,转载请声明来源钻瓜专利网。