[发明专利]云存储文件系统在审

专利信息
申请号: 201310232354.4 申请日: 2013-06-01
公开(公告)号: CN103473258A 公开(公告)日: 2013-12-25
发明(设计)人: 陈莉君;康华;贾威威;王博 申请(专利权)人: 西安邮电大学
主分类号: G06F17/30 分类号: G06F17/30;G06F11/14
代理公司: 暂无信息 代理人: 暂无信息
地址: 710061 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 存储 文件系统
【说明书】:

技术领域

本发明涉及一种数据存储技术,特别涉及一种云存储文件系统。

背景技术

HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS一般部署在集群环境中,而且这个集群环境是一个主从(master/slave)系统。在这个系统中有一个命名节点(Namenode)和若干个数据节点(Datanode),命名节点上存储着所有元数据(Meta-data),而数据节点上存储着所有用户数据,这些数据被组织成数据块的形式放在数据节点上,每个数据块默认存放在三个数据节点(可配置)上,用户的请求(读写等)都是通过命名节点,进而操作数据节点。HDFS一次写入不能更改,只可多次读取。一旦创建了一个HDFS文件,并且写入了数据,关闭之后就不能再修改这些数据了。这种方式简化了数据一致性,同时也使高数据吞吐量变为可能。但是,这种方式也限制了用户对数据的操作,这是HDFS的一个鲜明的缺点。

日志结构文件系统(Log-Structured File System)最早由John K.Ousterhout和Fred Douglis在1988年提出。这种设计是为了提高写数据吞吐量,所有对数据和元数据的更新都是以日志的形式追加,形成一个线性的数据结构。日志结构文件系统(LFS)会不断的追加日志结构,日志中元数据的数据量有可能大于可用数据,每次更新都会产生元数据,那么存储空间就成为我们关注的核心问题,这么多的冗余数据应该如何处理。这就是日志结构文件系统的缺点。

虽然,中国专利CN201010624684.4公开了一种分布式文件系统的数据存储处理方法,其特征在于,包括:接收分布式文件系统客户端发送的访问请求;根据所述访问请求确定所述分布式文件系统客户端所要访问的存储单元以及所述存储单元对应的虚拟资源池状态,所述存储单元与其对应的虚拟资源池存储有相同的数据,所述虚拟资源池为根据具有相同活动周期的分布式文件系统客户端聚类生成;在确定所述存储单元对应的虚拟资源池处于上线状态时,向发起访问请求的分布式文件系统客户端返回包括客户端标识的访问响应消息,所述客户端标识所标识的分布式文件系统客户端为所述虚拟资源池中的一个,且根据所述访问请求确定。上述技术方案能够提高分布式文件系统的系统稳定性,但并没能进一步解决冗余数据问题。类似的专利技术还有很多,但都程度不同地存在着稳定性和实用性不佳的问题,尚有待于进一步改进完善。

发明内容

本发明的目的在于提供一种云存储文件系统,可以实现对数据的随机读写以及I/O效率的提高,从而解决上述问题。

为实现上述发明目的,本发明的技术方案是:一种云存储文件系统,包括:Hadoop分布式文件系统和日志结构块存储系统;所述Hadoop分布式文件系统,用于提供分布式的存储介质;所述日志结构块存储系统是基于日志结构文件系统理念而实现随机读写,它还包括快照单元,克隆单元,块压缩单元,缓存单元。

作为本发明的优选实施例,所述Hadoop分布式文件系统包括:接收分布式文件系统客户端发送的访问请求;根据所述访问请求确定所述分布式文件系统客户端所要访问的存储单元以及所述存储单元对应的虚拟资源池状态,所述存储单元与其对应的虚拟资源池存储有相同的数据,所述虚拟资源池为根据具有相同活动周期的分布式文件系统客户端聚类生成;在确定所述存储单元对应的虚拟资源池处于上线状态时,向发起访问请求的分布式文件系统客户端返回包括客户端标识的访问响应消息,所述客户端标识所标识的分布式文件系统客户端为所述虚拟资源池中的一个,且根据所述访问请求确定。

在本发明中,HLBS的磁盘数据格式与一般文件系统无多大差异,都是借助于data block、indirect block、inode等结构。所不同之处在于LBS会将磁盘(这里是HDFS的存储池)分割成有序的segment进行管理,当前活跃的segment只有一个(也就是日志的逻辑尾的segment)。这些segment逻辑上头尾相连组成线性logs,任何对文件的更新(data block、indirect block、inode等等)都会以追加方式写入一个新的log——显然这么做的好处是保证了磁头的顺序移动,提高了吞吐量;而带来的麻烦是需要回收前期写入的旧数据(修改过的),否则磁盘迟早会写满。综上所述我们设计的基本思路是——利用HDFS为我们提供可靠的、分布式的存储介质;然后在其上实现LBS。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310232354.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top