[发明专利]文件归档方法和装置在审
申请号: | 202110320066.9 | 申请日: | 2021-03-25 |
公开(公告)号: | CN112925746A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 郭丹枫;李林哲;关墨辰;肖新光 | 申请(专利权)人: | 北京安天网络安全技术有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11 |
代理公司: | 北京格允知识产权代理有限公司 11609 | 代理人: | 周娇娇 |
地址: | 100195 北京市海淀区玉泉山闵庄路3号*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 归档 方法 装置 | ||
本发明涉及一种文件归档方法和装置,方法包括:确定待归档文件;按照预设归档文件结构,在归档文件包中依次写入每一个待归档文件的文件信息;在该归档文件包中,从写入的文件信息的尾部开始,依次写入每一个待归档文件的文件内容,得到对确定的待归档文件进行归档后的归档文件包;其中,文件内容的写入顺序与文件信息的写入顺序相同。本发明的归档文件包中包括两个部分,一个部分为文件信息,另一个部分为文件内容,且文件内容在归档文件包的位置位于文件信息的尾部,在后续对文件进行检索时,可以直接读取位于归档文件包头部的文件信息,而无需读取整个归档文件包,即可确定出该归档文件包中包括哪些已归档文件,提高了文件检索效率。
技术领域
本发明涉及文件处理技术领域,尤其涉及一种文件归档方法和装置。
背景技术
在计算机中存储有各种各样的文件,当存储文件较多时,可以通过文件归档的方式对文件进行备份管理。现有技术中,可以采用文件打包存储的方式进行文件归档。但是现有的文件归档方法在进行了文件归档之后,存在检索效率低的问题。因此,需要提供一种检索效率更高的文件归档方法。
发明内容
本发明要解决的技术问题在于文件检索效率低,针对现有技术中的缺陷,提供一种文件检索效率更高的文件归档方法和装置。
为了解决上述技术问题,本发明提供了一种文件归档方法,包括:
确定待归档文件;
按照预设归档文件结构,在归档文件包中依次写入每一个待归档文件的文件信息;
在该归档文件包中,从写入的文件信息的尾部开始,依次写入每一个待归档文件的文件内容,得到对确定的待归档文件进行归档后的归档文件包;其中,文件内容的写入顺序与文件信息的写入顺序相同。
优选地,在所述确定待归档文件之后,所述在归档文件包中依次写入每一个待归档文件的文件信息之前,进一步包括:
遍历每一个待归档文件,以获取每一个待归档文件的唯一标识信息;
确定已归档的至少一个归档文件包;
针对每一个归档文件包,均执行:读取该归档文件包中的文件信息,以确定出该归档文件包中包括的每一个已归档文件的唯一标识信息;
根据每一个待归档文件的唯一标识信息和每一个已归档文件的唯一标识信息,从所述待归档文件中去除与已归档文件重合的文件,得到去重后的待归档文件。
优选地,所述唯一标识信息包括:文件名称、文件存储路径和文件哈希值中的至少一项。
优选地,在所述在归档文件包中依次写入每一个待归档文件的文件信息之前,进一步包括:
在归档文件包的头部,写入文件类型、文件个数和文件总大小中的至少一项属性信息;
在该归档文件包中写入的属性信息的尾部开始,执行所述在归档文件包中依次写入每一个待归档文件的文件信息。
优选地,所述写入每一个待归档文件的文件信息,包括:
针对每一个待归档文件,均执行:确定该待归档文件的文件大小、文件全路径长度、文件全路径内容、文件附加项个数以及每一个文件附加项信息;将确定的信息写入到归档文件包中与该待归档文件的文件信息对应的位置处。
优选地,所述文件附加项信息包括:附加项类型、附加项内容长度和附加项内容。
本发明实施例还提供了一种文件归档装置,包括:
第一确定单元,用于确定待归档文件;
写入单元,用于按照预设归档文件结构,在归档文件包中依次写入每一个待归档文件的文件信息;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安天网络安全技术有限公司,未经北京安天网络安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110320066.9/2.html,转载请声明来源钻瓜专利网。