[发明专利]一种重组docx文件碎片数据的方法有效
申请号: | 201510604859.8 | 申请日: | 2015-09-18 |
公开(公告)号: | CN105183877B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 梁效宁;许超明;赵飞 | 申请(专利权)人: | 四川效率源信息安全技术股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 641000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种重组docx文件碎片数据的方法,包括以下步骤:S1:解析文件系统;S2:扫描一个docx文件;S3:分析xml位图索引表结构;S4:得到docx文件数据区存储位置;S5:重组docx文件;S6:判断是否完成扫描,是则执行S7,否则执行S2;S7:将docx文件解压并转换显示文本。本发明可以根据文件特征找到丢失docx文件的数据区与尾部xml索引表,根据xml索引表解析出docx文件数据区位置;根据docx文件数据区与xml索引表组合成为一个特定格式的文件;即使文件部分被损坏,也可以恢复其余部分的数据,将因数据丢失带来的损失降到最低。 | ||
搜索关键词: | 一种 重组 docx 文件 碎片 数据 方法 | ||
【主权项】:
1.一种重组docx文件碎片数据的方法,其特征在于包括以下步骤:S1:解析文件系统,区分正常区域和空闲区域;S2:按顺序在空闲区域中扫描一个docx文件特征;S3:分析获得docx文件尾部的xml位图索引表结构;S4:解析xml索引表得到docx文件数据区数据存储位置;所述S4的详细步骤如下:S401:按顺序提取一条xml索引信息;S402:通过xml索引信息内的位置特征找到对应的数据区头部,在通过数据区头部特征找到数据区起始位置和结束位置;S403:根据xml索引信息的结构与数据区内数据进行匹配,若与结构特征匹配成功则认为此数据区数据可用,执行S404;若没有匹配效验码则说明此数据区数据已被损坏执行S405;S404:记录该数据区位置;S405:判断xml索引表是否提取完成,完成则结束,未完成则执行S401;S5:按照S3得到的xml位图索引表及S4中分配的数据区存储结构重组docx文件;S6:判断是否完成空闲区的扫描,是则执行S7,否则执行S2;S7:将重组的docx文件解压后按照xml格式提取关键文字信息并转换为txt文件显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川效率源信息安全技术股份有限公司,未经四川效率源信息安全技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510604859.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种加速度振动烈度传感器的安装结构
- 下一篇:一种无障碍停车库