[发明专利]一种基于数据差异的逻辑卷快速同步方法有效
申请号: | 200810225596.X | 申请日: | 2008-11-07 |
公开(公告)号: | CN101387976A | 公开(公告)日: | 2009-03-18 |
发明(设计)人: | 汪东升;刘宏;詹球翔;徐学雷;生拥宏;鞠秀芳;鞠大鹏;李泓 | 申请(专利权)人: | 清华大学;北京威视数据系统有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所 | 代理人: | 廖元秋 |
地址: | 1000*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 差异 逻辑 快速 同步 方法 | ||
技术领域
本发明属于计算机数据存储技术领域,主要解决连续数据保护系统中源卷与目的卷数据不一致时,将源卷与目的卷的数据进行快速同步,使数据重新达到一致的问题。
背景技术
如今,计算机无论对于个人、企业还是政府的重要性越来越大,尤其是存储在计算机中的重要数据,一旦这些数据丢失和被破坏,损失将难以估计,现有的数据保护技术,如RAID、远程镜像、卷影复制服务、快照等,从实现层次上可分为物理块级、逻辑卷级、文件级或应用级。其中在逻辑卷级进行数据保护具有与上层应用和具体物理设备无关等优点。
当数据由于软,硬件故障遭受破坏后,数据恢复所需时间的长短在很大程度上影响了损失的大小,当需要进行恢复时,如何快速、有效的将目的卷上的数据同步到源卷上,是数据保护系统的一个重要指标;同时经过一段时间运行后,源卷与目的卷上的数据不一致,此时如何快速的使源卷与目的卷上的数据一致,是需要考虑的另一个重要问题。
在数据保护系统中,数据操作通常集中在被保护数据的有限区域,因此存在大量的未变化数据,即保护数据和被保护数据将存在大量的相同数据,在数据同步时为减少同步数据量和同步时间这些数据不需要进行传输。
Rsync是基于Unix/Linux平台上性能优异的备份/恢复程序,其独特的Rsync算法能够快速地找到目标文件与备份文件之间的差异,在网络上只传输文件的差异部分,使本地和远程两个主机之间的文件达到同步,具有占用网络带宽少、同步速度快等特点。
虽然Rsync具有诸多优点,但由于在文件系统级实现,在文件系统视图中相同数据,在逻辑卷上数据并不一定相同,即文件系统上相同的文件,可以存在于逻辑卷上不同的位置,因此Rsync只能保证文件系统级的数据同步,而无法满足逻辑卷级数据严格相同的同步要求。
发明内容
本发明的目的是解决当系统运行一段时间后源卷与目的卷数据发生不一致或源卷数据遭受破坏时,进行快速数据同步使源卷与目的卷的数据重新达到一致状态的问题;提出种基于数据差异的逻辑卷数据快速同步方法,本发明在数据同步时只比较已使用数据块,明显的减少了数据比较的范围,同时在同步时只同步发生变化的数据块,有效减少了同步的数据量。
本发明提出的一种基于数据差异的逻辑卷数据快速同步方法,其特征在于;
根据源卷和目的卷的文件系统信息找到各自逻辑卷上已使用的数据块,比较源逻辑卷与目的逻辑卷上对应的数据块(位置相同、大小相等的数据块)对,计算该数据块对的两个特征值,若该两个特征值不相同(表示数据有变化),则对该数据块对进行同步处理,否则,不进行同步处理。
该方法设源逻辑卷L1在机器M1上,目的逻辑卷L2在机器M2上,L1与L2大小相同,而且L1与L2的数据块大小相同,M1和M2通过网络连接,当要将L2上的数据同步到L1的状态时,设一次比较的数据块数量为K块,K最大值为MAX,最小值为MIN,该方法包括以下步骤:
1)M1与M2同时解析L1,L2上的文件系统信息,读取所述逻辑卷L1,L2上的表示数据空间使用情况的位图信息$Bitmap1,$Bitmap2(位图信息中每一位对应逻辑卷一个数据块的使用情况,$Bitmap1,$Bitmap2中每一位是一一对应的,每一位由0或1组成),其中0表示未使用,1表示已使用;
2)M1将$Bitmap1发送到M2;
3)M2比较$Bitmap1与$Bitmap2中对应的每一位,获取对应位连续都为1的个数,同时判断比较是否完成,若是则结束,否则进入步骤4);
4)M2从连续都为1的个数对应的数据块中动态确定比较信息(包括数据块数量K的大小、数据块的起始位置);
5)M2根据步骤4)中确定的比较信息,从L2中预取已使用数据块并存放至M2中的缓冲区;
6)M2根据步骤4)中获取的比较信息发送给M1,M1根据步骤4)中确定的比较信息,从L1中预取已使用数据块并存放至M1中的缓冲区;
7)M1,M2同时计算存储在各自缓冲区中相同位置相同大小的已使用数据块的特征值(比如采用CRC校验,MD4值等作为特征值);
8)M1将计算得到的特征值发送给M2,M2将接收到的M1发送的特征值和本端计算得到的特征值进行比较,若相同则进入步骤3),否则进入步骤9);
9)M2将特征值不相同对应的数据块发送到M1,进入步骤3),M1将该数据块写入相应的逻辑卷位置。
本发明的技术特点和效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京威视数据系统有限公司,未经清华大学;北京威视数据系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810225596.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置