[发明专利]一种数据压缩过程中的编码方法在审

申请号：	201911057994.X	申请日：	2019-10-31
公开（公告）号：	CN110944040A	公开（公告）日：	2020-03-31
发明（设计）人：	高明;应丽莉;焦海;罗锦;周慧颖	申请（专利权）人：	浙江工商大学
主分类号：	H04L29/08	分类号：	H04L29/08;H04L29/06;G06F16/22;G06F16/27
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	杨舟涛
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据压缩过程中的编码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公布了一种数据压缩过程中的编码方法。本发明步骤如下：步骤(1)对于关键数据流用分块算法进行分块；步骤(2)将分块后的数据块在重复数据库中进行检测；步骤(3)计算该数据块的MD5值并与重复数据库进行比对，当计算出的MD5值不在重复数据库时，执行步骤(4)，否则执行步骤(5)；步骤(4)对过滤出来的MD5值不重复数据块进行数据处理；步骤(5)对过滤出来的MD5值重复数据块进行数据处理；步骤(6)重复数据库对库中频率计数器进行统计，淘汰替换率低的数据块；步骤(7)等待下一次的数据流的到来。本发明有效的编码方法过滤了原数据流中的低频数据块，减少了重复数据库检索的压力，提高了数据传输效率。

技术领域

本发明属于网络通信技术领域，尤其涉及一种数据压缩过程中的编码方法。

背景技术

在目前的广域网中约有60％的流量都是重复的，这会造成广域网中数据的反复重传以及大量的数据冗余。

目前广域网加速技术的研究已较为成熟，但是依然存在着算法的复杂度较高、内存消耗大、加速策略单一的缺点，将广域网加速的数据压缩运用到SD-WAN中来，对重复数据库存储机制进行改进，实现关键数据流的优先、加速传输。

在这种数据压缩编码过程中，对传统的重复数据库进行改进，添加了新的频率计数器字段，接着数据压缩模块运行并与重复数据库进行交互，执行查询、替换等操作，TCP代理对数据流进行重组后发往广域网中进行传输。这种编码过程过滤了原数据流中的低频数据块，减少了重复数据库检索的压力。

发明内容

本发明的目的是克服现有技术的不足，提出一种数据压缩过程中的编码方法。

本发明解决其技术问题所采用的技术方案包含如下步骤：

步骤(1)对于关键数据流用分块算法进行分块；所述关键数据流是指一类有特定QoS需求的数据流的集合；

所述的分块算法是一种结合了固定分块算法、Bloom Filter算法和MD5算法的数据分块算法；

步骤(2)将分块后的数据块在重复数据库中进行检测；