[发明专利]基于LZSS算法和Sunday算法的数据压缩方法及系统有效
申请号: | 202011559946.3 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112671413B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 吴楠;曹博;高翔宇 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | H03M7/40 | 分类号: | H03M7/40 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lzss 算法 sunday 数据压缩 方法 系统 | ||
1.一种基于LZSS算法和Sunday算法的数据压缩方法,其特征在于,该方法是利用熵编码对待压缩数据进行预处理并选取压缩标准,同时将窗口变为动态设置大小,设定一个最小的匹配长度,并找到匹配的最大字符串提高压缩效率,再通过Sunday字符串匹配算法降低字符串匹配时的时间消耗;具体步骤如下:
S1、对应不同的压缩数据,采用不同熵编码进行预处理;
S2、确定选取的压缩标志并置于数据首位;
S3、将窗口大小设为动态可变;
S4、在将字符串匹配时,设定一个最小匹配长度,将小于此长度的字符串正常打印到动态窗口;
S5、开始进行压缩处理;
S6、匹配第一次的字符串;
S7、采用Sunday算法找寻是否有字符串的匹配项:
①、若是,则执行步骤S8;
②、若否,则跳转至步骤S10;
S8、在最新位置查看是否顺延:
①、若是,则执行步骤S9;
②、若否,则跳转至步骤S7;
S9、得到新的字符串并记录,下一步跳转至步骤S7;
S10、得到存在的最大字符串;
S11、要压缩的字符串是否结束:
①、若是,则执行步骤S12;
②、若否,则跳转至步骤S6;
S12、结束。
2.根据权利要求1所述的基于LZSS算法和Sunday算法的数据压缩方法,其特征在于,步骤S1中的熵编码进行预处理前,通过LSZZ算法找寻之前出现的字符串中是否已出现相同的字符串段落,对未重复出现过的字符串段落原样输出。
3.根据权利要求1所述的基于LZSS算法和Sunday算法的数据压缩方法,其特征在于,压缩数据中超过60%的内容格式固定时,采用huffman编码方式进行熵编码。
4.根据权利要求1所述的基于LZSS算法和Sunday算法的数据压缩方法,其特征在于,压缩标志选取原则如下:
①、选取不常用到的压缩标志;
②、找寻未出现过的标志或出现频率最小的标志并注明;
③、若出现相同标注需要压缩,则进行一次重复来区别。
5.根据权利要求1-4中任一所述的基于LZSS算法和Sunday算法的数据压缩方法,其特征在于,步骤S3中将窗口大小设为动态可变具体如下:
延用LZSS算法中的动态窗口和预读窗口方法,将固定长度的窗口变为长度动态可变的窗口;
在压缩时,偏移执行靠近窗口末尾的部分;
在窗口大小固定的情况下,编码需要的大小为upper-bound(log2(n))。
6.一种基于LZSS算法和Sunday算法的数据压缩系统,其特征在于,该系统包括,
预处理模块,用于对不同的压缩数据,采用不同熵编码进行预处理;
选取模块,用于确定选取的压缩标志并置于数据首位;
设定模块一,用于将窗口大小设为动态可变;
设定模块二,用于在将字符串匹配时,设定一个最小匹配长度,将小于此长度的字符串正常打印到动态窗口;
压缩模块,用于开始进行压缩处理;
匹配模块,用于匹配字符串;其中,匹配模块工作过程步骤如下:
(1)、匹配第一次的字符串;
(2)、采用Sunday算法将此字符串和其位置后需要匹配的字符串进行匹配,并找寻是否有字符串匹配项:
①、若后续不存在匹配项,则跳转至步骤(5);
②、若后续存在匹配项,则执行步骤(3);
(3)、继续尝试将字符串进行后延来找到更大的匹配字符串,即在最新位置查看是否顺延:
①、若存在更大的字符串,则执行步骤(4);
②、若匹配成功时,则不能后延,保留原纪录并继续向后匹配来找寻下一个匹配字符串的位置,则跳转至步骤(2);
(4)、将其记录下来并重复进行字符串匹配操作,下一步跳转至步骤(2);
(5)、得到存在的最大字符串,将已得的字符串进行正常压缩处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011559946.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种叠片式自动排片机
- 下一篇:一种检测授权的方法、装置、终端及存储介质