[发明专利]一种CephFS文件系统的备份方法及系统在审
申请号: | 202010900678.0 | 申请日: | 2020-09-01 |
公开(公告)号: | CN112069127A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 宋瑞霞;金友兵 | 申请(专利权)人: | 南京卓盛云信息科技有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/182 |
代理公司: | 深圳深瑞知识产权代理有限公司 44495 | 代理人: | 穆瑞丹 |
地址: | 211103 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 cephfs 文件系统 备份 方法 系统 | ||
本发明公开了一种CephFS文件系统的备份方法及系统,包括:获取CephFS文件系统中的元数据存储池的快照;判断元数据存储池是否仅有本次快照,若是,则把CephFS挂载目录下的文件全部传输到从备份客户端进行全量备份,若不是,则遍历访问元数据存储池内的所有对象,筛选出同时具备包含CDentry条目、前后两次快照内容不相同以及CDentry条目指向和描述的是一个文件信息的对象;每筛选出一个对象,则备份文件信息所对应的文件。该CephFS文件系统备份方法,可以快速的发现出需要备份的新文件,实现快速的增量备份。
技术领域
本发明涉及一种信息存储技术领域,特别涉及一种分布式文件系统的备份方法及系统。
背景技术
Ceph是一种分布式存储,同时支持块、文件和对象存储,其中CephFS就是Ceph的文件存储解决方案。作为一种分布式文件存储CephFS具有线性扩展、高可靠和高可用的能力,对外具有海量文件共享存储和共享访问的能力。对于CephFS文件系统中,采用类似NFS或者CIFS协议方式,多个客户端都可以同时挂载为一个目录下,然后访问该共享目录。
在某些数据安全性较高的场景,需要对CephFS文件系统进行备份。但是常规的数据备份方式需要遍历目录下的所有子目录和文件,当文件数据非常庞大时这种遍历和备份过程会很慢。尤其第一次备份完成后,后续进行增量备份,这时遍历目录和文件的过程仍然是非常耗时间。而且作为共享文件系统,存在多个客户端同时会创建和编辑不同的文件,这样也无法在某个客户端上采用Linux的inotify机制监测原始集群的文件更新情况。实际作为分布式存储,存储规模经常几百TB,PB级甚至EB级别,文件的个数达到几亿以上,甚至更高都很常见,这样目前常见的CephFS文件系统数据备份的过程都效率很低。
因此,如何提升CephFS系统的数据备份性能,实现快速的增量备份和文件遍历过程是本领域技术人员需要解决的一个问题。
发明内容
发明目的:提供一种CephFS文件系统的备份方法,可以快速的发现出需要备份的新文件,实现快速的增量备份。
技术方案:本发明所述的CephFS文件系统的备份方法,包括:
获取CephFS文件系统中的元数据存储池的快照;
判断元数据存储池是否仅有本次快照,若是,则把CephFS挂载目录下的文件全部传输到从备份客户端进行全量备份,若不是,则遍历访问元数据存储池内的所有对象,筛选出同时具备包含CDentry条目、前后两次快照内容不相同以及CDentry条目指向和描述的是一个文件信息的对象;
每筛选出一个对象,则备份文件信息所对应的文件。
在本发明备份方法的一个实施方案中,在筛选具备包含CDentry条目的对象时:
遍历访问元数据存储池内的每个对象,解析每个对象的内容,若该对象的内容不包含任何CDentry条目,则不做任何操作,跳过该对象;
若该对象的内容中包含有CDentry条目,则进一步对比该对象的前后两次快照的内容是否相同。
在本发明备份方法的一个实施方案中,在筛选具备前后两次快照内容不相同的对象时:
若前后两次快照内容相同,则不做任何操作,跳过该对象;
若前后两次快照内容不相同,则解析并遍历该对象的所有CDentry条目,进一步判断CDentry条目指向和描述的是否是一个文件信息。
在本发明备份方法的一个实施方案中,在筛选具备CDentry条目指向和描述的是一个文件信息的对象时:
若某个CDentry条目指向和描述的是一个目录信息,则跳过该CDentry条目;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京卓盛云信息科技有限公司,未经南京卓盛云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010900678.0/2.html,转载请声明来源钻瓜专利网。