[发明专利]一种文件扫描恢复方法及装置有效
申请号: | 201710371751.8 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107220146B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 谢智宏 | 申请(专利权)人: | 万兴科技股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王术兰 |
地址: | 851400 西藏自治区拉萨市柳梧新区东环路以西*** | 国省代码: | 西藏;54 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 扫描 恢复 方法 装置 | ||
本发明提供了一种文件扫描恢复方法及装置,该方法包括:获取磁盘分区的分配表;根据分配表包括的文件记录,建立文件头特征库;当检测到恢复文件指令时,根据文件头特征库和分配表,在磁盘分区的数据区恢复丢失文件。本发明通过对磁盘分区的分配表包括的文件记录进行分析,自动提取文件头特征,建立文件头特征库。如此建立的文件头特征库能够涵盖终端可以存储的所有文件类型,因此一定能覆盖用户丢失的文件的文件类型,减少文件恢复失败的情况。而且自动提取文件头特征,减少了人工干预,提高了文件恢复效率。且自动提取方式可扩展性强,支持文件头特征的不断更新。
技术领域
本发明涉及数据恢复技术领域,具体而言,涉及一种文件扫描恢复方法及装置。
背景技术
目前,用户经常使用存储设备存储文件,但有时因为误删操作或病毒破坏等软件问题造成文件丢失,此时需要对文件进行恢复,以找回丢失的文件。
当前,相关技术中存在一种全盘扫描技术,在文件丢失时,对每个磁盘分区的数据区进行逐字节扫描,判断扫描到的信息与特定文件格式的文件头特征是否匹配,特定文件格式包括doc(文档格式)、rar(压缩格式)或mp3(音频编码格式)等。如果匹配,且确定磁盘分区的分配表中不包含该扫描到的信息,则恢复扫描到的信息。如果不匹配,或者匹配但磁盘分区的分配表中包含该扫描到的信息,则不进行恢复操作。
在上述全盘扫描技术中,文件头特征是通过人工分析提取的,文件头特征数量固定,不一定能覆盖用户可能丢失的文件类型,导致恢复质量不高。且人工分析提取,扩展性差,人工干预也降低了文件恢复的效率。
发明内容
有鉴于此,本发明实施例的目的在于提供一种文件扫描恢复方法及装置,以解决现有技术存在的以下问题:文件头特征是通过人工分析提取的,文件头特征数量固定,不一定能覆盖用户可能丢失的文件类型,导致恢复质量不高。且人工分析提取,扩展性差,人工干预也降低了文件恢复的效率。
第一方面,本发明实施例提供了一种文件扫描恢复方法,所述方法包括:
获取磁盘分区的分配表;
根据所述分配表包括的文件记录,建立文件头特征库;
当检测到恢复文件指令时,根据所述文件头特征库和所述分配表,在所述磁盘分区的数据区恢复丢失文件。
结合第一方面,本发明实施例提供了上述第一方面的第一种可能的实现方式,其中,所述根据所述分配表包括的文件记录,建立文件头特征库,包括:
遍历所述分配表包括的文件记录,判断所述分配表中是否存在多个第一文件记录,所述多个第一文件记录为文件格式相同的文件对应的文件记录;
如果是,获取每个所述第一文件记录对应的文件头数据;
从获取的所述文件头数据中提取相同的文件头特征,将所述文件格式与提取的所述文件头特征对应存储到文件头特征库中。
结合第一方面的第一种可能的实现方式,本发明实施例提供了上述第一方面的第二种可能的实现方式,其中,所述获取每个所述第一文件记录对应的文件头数据,包括:
确定所述多个第一文件记录中是否包括第二文件记录,所述第二文件记录为带有删除标记的第一文件记录;
如果是,则去除所述第二文件记录带有的删除标记,获取所述第二文件记录包括的文件位置,及分别获取所述多个第一文件记录中除所述第二文件记录外的其他每个第一文件记录包括的文件位置;
如果否,则分别获取所述多个第一文件记录中每个第一文件记录包括的文件位置;
根据获取的所述文件位置,从磁盘分区的数据区中获取对应的文件头数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万兴科技股份有限公司,未经万兴科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710371751.8/2.html,转载请声明来源钻瓜专利网。