[发明专利]一种针对Gzip压缩数据的过滤方法及系统有效

专利信息
申请号: 201711070628.9 申请日: 2017-11-03
公开(公告)号: CN108090115B 公开(公告)日: 2022-05-17
发明(设计)人: 刘燕兵;王歧;卢毓海;张春燕;袁方方;谭建龙;郭莉 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G06F16/13 分类号: G06F16/13;G06F16/174;H04L67/02;H04L67/06
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 余长江
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 gzip 压缩 数据 过滤 方法 系统
【权利要求书】:

1.一种针对Gzip压缩数据的过滤方法,其步骤包括:

将Gzip压缩数据进行哈夫曼解码,得到LZ77压缩数据;

初始化缓存窗口、状态窗口以及KR多模式匹配算法的哈希表结构,对所述LZ77压缩数据进行KR搜索,获取flag信息;

如果所述LZ77压缩数据是ASCII码,则将正常字符加入到所述缓存窗口的一位置上,设置记录匹配状态在该缓存窗口位置的值为0,对该记录匹配状态的搜索位置的flag进行判断;

如果所述LZ77压缩数据是指针类型,找到起始位置并将该起始位置的某一长度的子串复制到所述缓存窗口的一位置上,同时将对应的flag状态也复制到记录匹配状态中,再从该缓存窗口的位置开始扫描所述长度;如果未扫描的剩余子串长度大于该记录匹配状态在该缓存窗口位置的绝对值,则保留该缓存窗口位置的值,否则将该值设为0,对该记录匹配状态的搜索位置的flag进行判断;

对所述flag进行判断包括:如果flag大于0,则直接获取成功匹配的信息;如果flag等于0,则进行KR多模式匹配算法匹配;如果flag小于0,则直接获取未成功匹配的信息;

根据对所述flag判断的结果更新所述搜索位置和所述缓存窗口的位置的值。

2.根据权利要求1所述的方法,其特征在于,所述初始化缓存窗口是将所述缓存窗口位置的值设为模式串最大长度值,将搜索位置置0。

3.根据权利要求1所述的方法,其特征在于,所述初始化状态窗口是将记录匹配长度置0。

4.根据权利要求1所述的方法,其特征在于,所述初始化KR多模式匹配算法的哈希表结构是指根据模式串哈希值将该值放入哈希表中。

5.根据权利要求1所述的方法,其特征在于,所述KR搜索的步骤包括:

根据目标字符串前一最小长度的子串的哈希值定位到哈希表中的位置;

如果该位置为空,则搜索结束,返回0;

如果该位置存在模式串,则将模式串逐一与目标字符串进行比较,如果命中,则记录命中信息并返回匹配成功的字符串最小长度;

如果未命中,则将最大匹配长度与所述最小长度进行比较,如果前者大于或等于后者,则返回最长匹配长度的相反数,否则返回0。

6.根据权利要求1所述的方法,其特征在于,所述指针用(length,distance)表示;其中distance表示重复字符串位置,长度在1~215之间;length表示字符串长度,长度在3~258之间。

7.根据权利要求1所述的方法,其特征在于,所述KR多模式匹配算法为:

对哈希表中每个模式串截取相同长度m作为关键子串;

通过计算关键子串的哈希值,插入到哈希表中相应位置;

在匹配时,截取目标文本长度为m的子串,计算其哈希值;

如果根据该计算的哈希值在哈希表中命中,则逐一检查各子串是否匹配成功。

8.根据权利要求1所述的方法,其特征在于,对所述缓存窗口的剩余字符进行KR搜索。

9.根据权利要求1所述的方法,其特征在于,重复对所述LZ77压缩数据进行KR搜索,并根据所述LZ77压缩数据是ASCII码或指针类型进行flag判断,以重复更新所述搜索位置和所述缓存窗口的位置的值。

10.一种针对Gzip压缩数据的过滤系统,包括存储器和处理器,该存储器存储计算机程序,该程序被配置为由该处理器执行,该程序包括用于执行上述权利要求1-9任一权利要求所述方法的各步骤指令。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711070628.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top