[发明专利]基于分级存储的分布式文件系统实现方法有效
申请号: | 201410756537.0 | 申请日: | 2014-12-10 |
公开(公告)号: | CN104462389B | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | 雍帅 | 申请(专利权)人: | 上海爱数信息技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 201112 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分级 存储 分布式 文件系统 实现 方法 | ||
1.一种基于分级存储的分布式文件系统实现方法,其特征在于,包括以下步骤:
1)对系统中的数据采用全局统一命名空间,建立无元数据服务的分布式文件系统;
2)将整个分布式文件系统根据业务需要划分为不同的逻辑分区;
3)对不同的逻辑分区选用不同的存储介质和存储方式;
4)逻辑分区间的数据实现自动迁移,并对迁移后的数据进行数据重定位;
所述的不同的逻辑分区包括高速集群逻辑分区、半活动集群逻辑分区和低速集群逻辑分区;
所述的逻辑分区间的数据实现自动迁移具体为:
41)数据使用信息模块采集文件的使用频率、文件的大小、文件所处的逻辑分区信息;
42)数据迁移管理模块根据数据使用信息模块采集信息和用户设定的迁移策略,触发对数据的迁移操作;
43)数据迁移执行模块完成对数据的迁移;
所述的数据迁移管理模块根据数据使用信息模块采集信息和用户设定的迁移策略,触发对数据的迁移操作具体为:
①在高速集群逻辑分区中设置容量迁移阀值,当容量达到阀值时,开始启动迁移;
②首先需要考虑数据的使用频度,根据LRU算法准备迁移数据,其次需要考虑数据迁移的成本,迁移算法具体为:迁移值=使用频率*权重A1-文件大小*权重B1;
③对于半活动集群逻辑分区或低速集群逻辑分区的数据若经常被访问,需要考虑数据回迁,数据回迁的策略值为:回迁值=文件所在区间*权重A2+上级区间所剩空间*权重B2。
2.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的分布式文件系统中的各个节点关系对等,并使用弹性哈希算法定位文件。
3.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的对不同的逻辑分区选用不同的存储介质具体为:
对高速集群逻辑分区选用大内存和固态硬盘的存储服务器;
对半活动集群逻辑分区选用SAS接口硬盘的存储服务器;
对低速集群逻辑分区选用SATA接口硬盘的存储服务器。
4.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的对不同的逻辑分区选用不同的存储方式具体为:
对高速集群逻辑分区选用三副本的存储模式;
对半活动集群逻辑分区和低速集群逻辑分区选用二副本或单副本外加软RAID的存储模式。
5.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的数据迁移执行模块进行热迁移,即在数据的迁移的过程应该不能中断上层的相关业务。
6.根据权利要求5所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的热迁移具体为:
当客户端访问的文件正在进行从逻辑分区A到逻辑分区B的迁移时,同步过程需要经过增量的迭代,只有当两边文件全部相同时,才能修改逻辑分区A的原有文件的元信息,将其定位到逻辑分区B上,同时将逻辑分区A上的数据删除已释放相应空间。
7.根据权利要求1所述的一种基于分级存储的分布式文件系统实现方法,其特征在于,所述的对迁移后的数据进行数据重定位具体为:
(1)客户端根据文件定位算法直接访问原文件;
(2)根据当前文件的元信息,返回重定位操作;
(3)根据重定位信息访问新的文件位置;
(4)获取相应的文件操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海爱数信息技术股份有限公司,未经上海爱数信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410756537.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种下载文件的方法及装置
- 下一篇:商标检索方法