[发明专利]一种计算数据的预期压缩率的方法及装置有效
申请号: | 201480036812.X | 申请日: | 2014-07-11 |
公开(公告)号: | CN106170760B | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 魏建生;朱俊华 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F5/00 | 分类号: | G06F5/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种计算数据的预期压缩率的方法及装置,涉及数据处理技术领域,在该方案中,是用表征符号序列中的符号的分布规律的相关指标来计算数据的预期压缩率的,表征符号序列中的符号的分布规律的相关指标与数据的预期压缩率相关性较高,因此,解决了现在在计算数据的预期压缩率的过程中存在的准确度较低的缺陷。 | ||
搜索关键词: | 一种 计算 数据 预期 压缩率 方法 装置 | ||
【主权项】:
1.一种计算数据的预期压缩率的方法,其特征在于,包括将待压缩数据解析为符号序列;获取所述符号序列的相关指标,其中,所述相关指标用于表征所述符号序列中的符号的分布规律;根据所述相关指标,计算将所述待压缩数据采用指定编码方式编码后的预期编码长度;将计算得到的预期编码长度与所述待压缩数据的初始长度的比值,作为所述待压缩数据的预期压缩率;其中,当所述相关指标包括符号集合的基数和/或符号频数集合时,所述根据所述相关指标,计算将所述待压缩数据采用指定编码方式编码后的预期编码长度,具体包括:根据所述符号集合的基数,计算所述符号集合所包括的任意一符号采用定长编码方式表达时所需要的位长,所述符号集合中的每一个符号采用所述定长编码方式表达时所需要的位长均相等;确定计算出的位长与所述符号频数集合中包括的所有频数之和的乘积;将确定的乘积作为第一预期编码长度,其中,所述第一预期编码长度为将所述待压缩数据采用所述定长编码方式编码得到的预期编码长度;或者,通过对所述符号频数集合进行递归划分,计算第二预期编码长度,其中,所述第二预期编码长度为将所述待压缩数据采用哈夫曼编码方式编码后的预期编码长度;其中,所述符号集合包括所述符号序列中出现的所有符号,且所述符号集合中的任意两个符号均不相同;所述符号集合的基数为所述符号集合中的所有符号的个数;所述符号频数集合中的频数为所述符号集合中的各个符号分别在所述符号序列中分别出现的次数;当所述待压缩数据的数据类型为二进制数据、所述相关指标包括游标集合的基数、游标位长、最大游程时;所述根据所述相关指标,计算将所述待压缩数据采用指定编码方式编码后的预期编码长度,具体包括:计算所述最大游程采用游程编码方式表达时所需要的位长,其中,游程集合中的每一个游程采用所述游程编码方式表达时所需要的位长,与所述最大游程采用所述游程编码方式表达时所需要的位长均相等;将计算出的所述最大游程采用所述游程编码方式表达时所需的位长,与所述游标集合的基数的乘积,作为计算出的所有游程采用所述游程编码方式表达所需要的位长;将所述游标位长与所述游标集合的基数的乘积,作为计算出的所有游标的位长;确定计算得到的所有游标的位长,与计算得到的所有游程采用所述游程编码方式表达所需要的位长之和;将所述位长之和作为第三预期编码长度,其中,所述第三预期编码长度为将所述待压缩数据采用所述游程编码方式编码得到的预期编码长度;其中,所述游标集合包括所述符号序列中与相邻的符号均不相同的符号,及每一组连续重复出现的符号中的任意一符号;所述游标集合的基数为所述游标集合中的所有符号的个数;所述游标位长为所述游标集合中的任意一游标的空间开销,其中,所述游标集合中包含的各游标的位长均相等;所述游程集合包括的游程为所述游标集合包括的游标在所述符号序列中的对应位置连续出现的次数;所述最大游程为各游标分别在所述符号序列中的对应位置连线出现的次数中的最大值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480036812.X/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置