[发明专利]数据文件解归档的方法和系统有效
申请号: | 200710169809.7 | 申请日: | 2007-11-07 |
公开(公告)号: | CN101178726A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 温卡特·温卡特苏布拉;卡维萨·拉玛林加姆;普拉莫德·A.·班迪瓦德;曼祖纳斯·B.·马特 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 付建军 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据文件 归档 方法 系统 | ||
技术领域
一般说来,本发明涉及改进的数据处理系统,确切地说,涉及计算机实施的方法、数据处理系统和计算机程序产品,用于在对同一文件系统中的文件进行解归档时高效地使用磁盘空间。
背景技术
在UNIX服务器中,“tar”命令通常用于对文件进行归档和解归档。归档包括将许多文件组合成单一文件的过程,该文件也称为归档文件。解归档包括从归档中重建若干原始文件的过程。为了在UNIX内对许多指定的数据文件进行归档,可以使用“tar”(用于磁带归档)命令从数据文件集创建归档文件。为了对归档文件进行解归档,使用了“tar”命令,它从归档文件中提取各个文件。由于“tar”不具有内建的数据压缩能力,“tar”常常与外部的压缩实用程序比如gzip或bzip2级联使用来压缩单一文件,以使归档空间最大化。
对文件进行解归档的过程目前需要与“tar”文件的大小相等的磁盘空间量可用。如果“tar”文件和提取的若干文件都需要在同一文件系统中,所述tar文件会把这些文件逐个提取到文件系统中。不过,如果文件系统中没有足够的空间容纳全部提取的文件,所述提取将会停止。所述“tar”文件在提取的过程期间保持不变,因为所述文件系统为了成功的提取需要具有等于所述“tar”文件的空闲空间。这种磁盘空间大小需求可能有问题,因为在许多情况下,“tar”文件可能占用大量的磁盘空间,执行解归档所需的空间量并非总是可得到。在这些磁盘空间状况下,系统管理员必须或者增加文件系统的大小以容纳解归档过程,或者清除文件系统中不想要的文件以获得所需的空间。
发明内容
展示性实施例提供了计算机实施的方法、数据处理系统和计算机程序产品,用于在对同一文件系统中的文件进行解归档时高效地使用磁盘空间。为了识别在归档文件中数据文件的总数目而读取所述归档文件。根据数据文件的总数目确定所述归档文件中文件头的数目。从归档文件中最大数据文件所对应的文件头中的偏移量,确定所述最大数据文件的第一磁盘空间的位置。然后将所述最大数据文件从所述第一磁盘空间中复制到第二磁盘空间。然后通过截断所述归档文件而释放由所述最大数据文件占据的所述第一磁盘空间。对所述归档文件中的每个数据文件都重复所述获得、复制和释放步骤,直到全部的数据文件都被解归档。
附图说明
在附带的权利要求书中阐明了本发明的新颖特征。不过,连同附图参考一个展示性实施例的以下详细说明,将会最好地理解发明本身以及其使用的优选模式、进一步的目的和优点,其中:
图1描述了分布式数据系统的图示,其中可以实施若干展示性实施例;
图2是数据处理系统的框图,其中可以实施若干展示性实施例;
图3是已知.tar文件格式的实例;
图4是展示性示范归档组件的框图,可以对其实施若干展示性实施例;
图5是根据若干展示性实施例的示范.tar文件格式;
图6是根据若干展示性实施例的示范文件头格式;
图7是根据若干展示性实施例的文件归档过程的流程图;以及
图8是根据若干展示性实施例的文件解归档过程的流程图。
具体实施方式
现在参考附图,尤其是参考图1至图2,图中提供了数据处理环境的示范图,其中可以实施若干展示性实施例。应当承认,图1至图2仅仅是示范例,而非力图宣称或暗示对于其中可以实施不同实施例的环境的任何限制。对所描述的环境可以做出许多修改。
现在参考附图,图1描述了数据处理系统网络的图示表达,其中可以实施若干展示性实施例。网络数据处理系统100是计算机的网络,其中可以实施若干实施例。网络数据处理系统100包含网络102,在网络数据处理系统100之内连接在一起的多种设备和计算机之间,它是用于提供通讯链接的媒介。网络102可以包括若干连接,比如有线、无线通讯连接或光缆。
在所描述的实例中,服务器104和服务器106连同存储单元108一起连接到网络102。另外,客户机110、112和114也连接到网络102。这些客户机110、112和114可以是例如个人计算机或网络计算机。在所描述的实例中,服务器104向客户机110、112和114提供数据,比如若干引导文件、操作系统映像和应用程序。在这个实例中客户机110、112和114是服务器104的客户机。网络数据处理系统100还可以包括未显示的附加服务器、客户机和其他设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710169809.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全局集成和多语言数据库系统
- 下一篇:地板砖