[发明专利]一种面向科学计算的浮点型数据无损压缩方法在审

申请号：	201510398051.9	申请日：	2015-07-08
公开（公告）号：	CN105024702A	公开（公告）日：	2015-11-04
发明（设计）人：	王彬;李帆;黑新宏;刘文娟;张丹;谢国;王磊	申请（专利权）人：	西安理工大学
主分类号：	H03M7/30	分类号：	H03M7/30
代理公司：	西安弘理专利事务所 61214	代理人：	李娜
地址：	710048***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向科学计算浮点数据无损压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于数据处理技术领域，具体涉及一种面向科学计算的浮点型数据无损压缩方法。

背景技术

随着社会的日益发展，由科学研究(天文学、生物学、海洋学)、社交网络(facebook、QQ、人人网)、自然环境监测(暴雨、洪水、地震)等产生的数以亿计的数据呈爆炸式增长，无论在工业界还是学术界，大规模数据处理都受到火热追捧。

数据的多样性和指数级增长给数据存储和传输带来了巨大压力，严重阻碍了高性能计算在科学领域的运用和发展。数据压缩一直是人们用于解决此类问题的热点技术，寻找高效的数据压缩技术可以有效降低数据存储量和传输成本。

数据压缩按解码后的数据是否完整恢复原数据，可分为有损压缩和无损压缩。有损压缩指的是解压缩时不能精确恢复原始数据，有一定的信息损失，该方法主要用于图像、视频、音频等少量信息遗失而不会影响原有数据效果的领域。无损压缩又称为熵编码、无失真编码，其工作原理是减少或去除数据中的冗余度，且原数据可被精确恢复。

对大部分科学数据而言，任何一个微小误差都将可能引发一场灾难，所以必须采用无损压缩技术，以保证数据恢复时的完整性；同时，数据压缩速度必须十分迅速，以适应科学数据规模大、密集度高、更新快等特点。

发明内容

本发明的目的是提供一种面向科学计算的浮点型数据无损压缩方法，解决了浮点型数据压缩率低、压缩缓慢的问题。

本发明所采用的技术方案是，一种面向科学计算的浮点型数据无损压缩方法，具体按照以下步骤实施：

步骤1、对浮点型数据的符号域、指数域和尾数域分别映射、分别压缩，并对压缩后的数据以二进制位为单位进行存储；

步骤2、获得尾数域差值的有效数据、指数域差值和符号域，并根据IEEE754格式和参考数据，完整恢复出原始数据，

其中，参考数据是前一个被压缩数据。

本发明的特点还在于：

步骤1具体为：

步骤1.1、内存拷贝参考数据和被压缩数据，将其分别转换为4个字节的整数；

步骤1.2、根据IEEE754格式，提取出参考数据和被压缩数据的符号域、指数域和尾数域；

步骤1.3、保持被压缩数据的符号域值不变；

步骤1.4、采用减法运算得出被压缩数据与参考数据的指数域差值，当指数域差值的值较小时，标记相应的标志位；当指数域差值的值较大时，单独存储被压缩数据的指数域，并标记相应的标志位；

步骤1.5、采用减法运算得出被压缩数据与参考数据的尾数域差值，删除尾数域差值头部的连续冗余0，存储有效数据，同时标记有效数据的个数；

步骤1.6、采用位位相接的方式封装所有数据尾数域差值的有效数据位，并封装被压缩数据的符号域、指数域及各种标志位，即实现了数据的完全无损压缩。

步骤1.4中指数域差值的值较小为被压缩数据与参考数据的指数域差值为0，1，-1，对应的标记位为0，1，2；指数域差值的值较大为被压缩数据与参考数据的指数域差值为其他，对应的标记位为3。

步骤2具体为：

步骤2.1、根据尾数部分的标志位值确定尾数域差值的有效数据位数，并按位从尾数域的压缩数据中取出该差值；然后由IEEE754格式可知该差值头部所需的冗余0位数，并对其进行填充；最后根据参考数据的尾数值恢复出被压缩数据的尾数域；

步骤2.2、根据指数部分的标志位值，如果获得的是指数域差值，根据参考数据的指数域恢复出被压缩数据的指数域，转到步骤2.3；如果获得的是被压缩数据的指数域，直接转到步骤2.3；

步骤2.3、从压缩数据中取出被压缩数据的符号域；

步骤2.4、按照IEEE754格式，组合符号域、指数域和尾数域变成4个字节的整数，并内存映射该整数使其还原成被压缩的浮点型数据。

本发明的有益效果是：本发明一种面向科学计算的浮点型数据无损压缩方法，所采用的尾数整型法(Think Mantissa as Integer，TMI)根据浮点型数据各部分的物理含义及结构特点，对数据各部分分别映射、分别压缩，打破了传统的浮点型数据压缩方法中，强行将其按字节划分，既破坏了浮点型数据的物理含义，又使压缩率低下；再者，本发明无损压缩方法没有过多的数据预测或变换算法，从而有利于加快数据压缩速度；最后，由于任何数据在计算机中都以二进制形式表示，所以该方法的思想可推广到其它数据类型的压缩。

附图说明

图1是本发明无损压缩方法中数据压缩的实施例流程图；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安理工大学，未经西安理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510398051.9/2.html，转载请声明来源钻瓜专利网。

上一篇：干扰组件的还原体系
下一篇：带后台校准的12位高速流水线模数转换器

同类专利

专利分类

H 电学

H03 基本电子电路
H03M 一般编码、译码或代码转换
H03M7-00 把用给定序列的数字或给定数目的数字来表示信息的码，转换到用不同序列的数字或不同数目的数字来表示相同信息的码
H03M7-02 .转换到加权代码或相反转换，即对一数字的加权与该数字在信息组或代码字中的位置有关
H03M7-14 .转换到非加权代码或相反转换
H03M7-26 .转换到随机码或相反转换
H03M7-28 .可编程序结构，即代码转换器所包括的设备其算符是可变的，以调整转换程序
H03M7-30 .压缩

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向科学计算的浮点型数据无损压缩方法在审

专利文献下载