[发明专利]一种重组docx文件碎片数据的方法有效
申请号: | 201510604859.8 | 申请日: | 2015-09-18 |
公开(公告)号: | CN105183877B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 梁效宁;许超明;赵飞 | 申请(专利权)人: | 四川效率源信息安全技术股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 641000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重组 docx 文件 碎片 数据 方法 | ||
1.一种重组docx文件碎片数据的方法,其特征在于包括以下步骤:
S1:解析文件系统,区分正常区域和空闲区域;
S2:按顺序在空闲区域中扫描一个docx文件特征;
S3:分析获得docx文件尾部的xml位图索引表结构;
S4:解析xml索引表得到docx文件数据区数据存储位置;所述S4的详细步骤如下:
S401:按顺序提取一条xml索引信息;
S402:通过xml索引信息内的位置特征找到对应的数据区头部,在通过数据区头部特征找到数据区起始位置和结束位置;
S403:根据xml索引信息的结构与数据区内数据进行匹配,若与结构特征匹配成功则认为此数据区数据可用,执行S404;若没有匹配效验码则说明此数据区数据已被损坏执行S405;
S404:记录该数据区位置;
S405:判断xml索引表是否提取完成,完成则结束,未完成则执行S401;
S5:按照S3得到的xml位图索引表及S4中分配的数据区存储结构重组docx文件;
S6:判断是否完成空闲区的扫描,是则执行S7,否则执行S2;
S7:将重组的docx文件解压后按照xml格式提取关键文字信息并转换为txt文件显示。
2.根据权利要求1的一种重组docx文件碎片数据的方法,其特征在于:
所述S3中通过找到xml数据头部特征,从头部特征向下扫描每一个xml信息并进行格式匹配,相同则继续向下扫描,不同则表示为xml数据尾部,记录整个xml数据,并根据数据特征生成xml位图索引表。
3.根据权利要求1的一种重组docx文件碎片数据的方法,其特征在于:所述S5中docx文件的重组按照正常docx文件结构的排列,S3得到的xml索引表排列在尾部,xml索引表所对应的数据区数据按照xml索引信息指向数据区的位置进行有序排列,若xml指向的数据区数据损坏也按照该数据区大小进行填充排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川效率源信息安全技术股份有限公司,未经四川效率源信息安全技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510604859.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加速度振动烈度传感器的安装结构
- 下一篇:一种无障碍停车库