[发明专利]一种计算数据的预期压缩率的方法及装置有效

专利信息
申请号: 201480036812.X 申请日: 2014-07-11
公开(公告)号: CN106170760B 公开(公告)日: 2019-11-05
发明(设计)人: 魏建生;朱俊华 申请(专利权)人: 华为技术有限公司
主分类号: G06F5/00 分类号: G06F5/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种计算数据的预期压缩率的方法及装置,涉及数据处理技术领域,在该方案中,是用表征符号序列中的符号的分布规律的相关指标来计算数据的预期压缩率的,表征符号序列中的符号的分布规律的相关指标与数据的预期压缩率相关性较高,因此,解决了现在在计算数据的预期压缩率的过程中存在的准确度较低的缺陷。
搜索关键词: 一种 计算 数据 预期 压缩率 方法 装置
【主权项】:
1.一种计算数据的预期压缩率的方法,其特征在于,包括将待压缩数据解析为符号序列;获取所述符号序列的相关指标,其中,所述相关指标用于表征所述符号序列中的符号的分布规律;根据所述相关指标,计算将所述待压缩数据采用指定编码方式编码后的预期编码长度;将计算得到的预期编码长度与所述待压缩数据的初始长度的比值,作为所述待压缩数据的预期压缩率;其中,当所述相关指标包括符号集合的基数和/或符号频数集合时,所述根据所述相关指标,计算将所述待压缩数据采用指定编码方式编码后的预期编码长度,具体包括:根据所述符号集合的基数,计算所述符号集合所包括的任意一符号采用定长编码方式表达时所需要的位长,所述符号集合中的每一个符号采用所述定长编码方式表达时所需要的位长均相等;确定计算出的位长与所述符号频数集合中包括的所有频数之和的乘积;将确定的乘积作为第一预期编码长度,其中,所述第一预期编码长度为将所述待压缩数据采用所述定长编码方式编码得到的预期编码长度;或者,通过对所述符号频数集合进行递归划分,计算第二预期编码长度,其中,所述第二预期编码长度为将所述待压缩数据采用哈夫曼编码方式编码后的预期编码长度;其中,所述符号集合包括所述符号序列中出现的所有符号,且所述符号集合中的任意两个符号均不相同;所述符号集合的基数为所述符号集合中的所有符号的个数;所述符号频数集合中的频数为所述符号集合中的各个符号分别在所述符号序列中分别出现的次数;当所述待压缩数据的数据类型为二进制数据、所述相关指标包括游标集合的基数、游标位长、最大游程时;所述根据所述相关指标,计算将所述待压缩数据采用指定编码方式编码后的预期编码长度,具体包括:计算所述最大游程采用游程编码方式表达时所需要的位长,其中,游程集合中的每一个游程采用所述游程编码方式表达时所需要的位长,与所述最大游程采用所述游程编码方式表达时所需要的位长均相等;将计算出的所述最大游程采用所述游程编码方式表达时所需的位长,与所述游标集合的基数的乘积,作为计算出的所有游程采用所述游程编码方式表达所需要的位长;将所述游标位长与所述游标集合的基数的乘积,作为计算出的所有游标的位长;确定计算得到的所有游标的位长,与计算得到的所有游程采用所述游程编码方式表达所需要的位长之和;将所述位长之和作为第三预期编码长度,其中,所述第三预期编码长度为将所述待压缩数据采用所述游程编码方式编码得到的预期编码长度;其中,所述游标集合包括所述符号序列中与相邻的符号均不相同的符号,及每一组连续重复出现的符号中的任意一符号;所述游标集合的基数为所述游标集合中的所有符号的个数;所述游标位长为所述游标集合中的任意一游标的空间开销,其中,所述游标集合中包含的各游标的位长均相等;所述游程集合包括的游程为所述游标集合包括的游标在所述符号序列中的对应位置连续出现的次数;所述最大游程为各游标分别在所述符号序列中的对应位置连线出现的次数中的最大值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201480036812.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top