[发明专利]一种面向科学计算的浮点型数据并行无损压缩方法在审
申请号: | 201510398153.0 | 申请日: | 2015-07-08 |
公开(公告)号: | CN105022631A | 公开(公告)日: | 2015-11-04 |
发明(设计)人: | 王彬;李帆;刘文娟;黑新宏;谢国;王磊;张丹 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F9/44 | 分类号: | G06F9/44;H03M7/30 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 李娜 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 科学 计算 浮点 数据 并行 无损 压缩 方法 | ||
1.一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,将TMI方法由CPU转移到GPU,并采用棋盘分割的方式得以充分利用GPU提供的众核技术,加快数据处理流程。
2.根据权利要求1所述的一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,所述CPU内部的具体工作步骤为:
步骤1.1、初始化GPU,获得GPU的各种参数,并创建命令队列;
步骤1.2、创建GPU的Kernel压缩程序和Kernel解压缩程序的执行命令;
步骤1.3、申请保存压缩完成后的有效数据位和标志位数据的GPU内存空间;
步骤1.4、转换待压缩数据使其变成可被GPU识别的维度和格式;
步骤1.5、将步骤1.4转换后的数据由CPU发送到GPU;
步骤1.6、根据命令队列控制GPU端Kernel压缩程序的运行;
步骤1.7、根据命令队列控制GPU端Kernel解压缩程序的运行。
3.根据权利要求2所述的一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,所述步骤1.1具体为:首先获取支持GPU的平台信息;然后获取GPU的设备信息;最后根据平台信息和GPU的设备信息创建上下文和命令队列;
其中,GPU的设备信息包括GPU的型号,GPU能运行的最大线程数,GPU的内存大小,GPU所支持的全局内存大小和局部内存大小。
4.根据权利要求2所述的一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,所述GPU内部的具体工作步骤为:
步骤2.1、接收CPU发送的数据;
步骤2.2、获取步骤2.1中接收到的数据的工作组编号,根据该编号确定数据压缩和解压缩时的线程编号;
步骤2.3、根据步骤2.2得到的线程编号和工作组编号确定哪部分数据由哪个线程处理压缩和解压缩;
步骤2.4、采用TMI压缩方法进行数据压缩,并将压缩后的数据按位存储;
步骤2.5、采用TMI解压缩方法进行数据解压缩。
5.根据权利要求4所述的一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,所述步骤2.2中工作组编号的获取具体为:将所有数据的维度视作全局工作空间,每个数据的位置编号视作相应维度上的全局编号;对全局工作空间分块,将每块视作工作组空间,块的位置编号视作相应维度上的工作组编号;工作组空间内的数据的位置相对工作组空间的位置视作局部位置。
6.根据权利要求4所述的一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,所述步骤2.4的具体步骤为:
步骤2.4.1、内存拷贝参考数据和被压缩数据,将其分别转换为4个字节的整数,
其中,参考数据是前一个被压缩数据;
步骤2.4.2、根据IEEE754格式,提取出参考数据和被压缩数据的符号域、指数域和尾数域;
步骤2.4.3、保持被压缩数据的符号域值不变;
步骤2.4.4、采用减法运算得出被压缩数据与参考数据的指数域差值,当指数域差值的值较小时,标记相应的标志位;当指数域差值的值较大时,单独存储被压缩数据的指数域,并标记相应的标志位;
步骤2.4.5、采用减法运算得出被压缩数据与参考数据的尾数域差值,删除尾数域差值头部的连续冗余0,存储有效数据,同时标记有效数据的个数;
步骤2.4.6、采用位位相接的方式封装所有数据尾数域差值的有效数据位,并封装被压缩数据的符号域、指数域及各种标志位,即实现了数据的完全无损压缩。
7.根据权利要求4所述的一种面向科学计算的浮点型数据并行无损压缩方法,其特征在于,所述步骤2.5具体步骤为:
步骤2.5.1、根据尾数部分的标志位值确定尾数域差值的有效数据位数,并按位从尾数域的压缩数据中取出该差值;然后由IEEE754格式可知该差值头部所需的冗余0位数,并对其进行填充;最后根据参考数据的尾数值恢复出被压缩数据的尾数域;
步骤2.5.2、根据指数部分的标志位值,如果获得的是指数域差值,根据参考数据的指数域恢复出被压缩数据的指数域,转到步骤2.3;如果获得的是被压缩数据的指数域,直接转到步骤2.3;
步骤2.5.3、从压缩数据中取出被压缩数据的符号域;
步骤2.5.4、按照IEEE754格式,组合符号域、指数域和尾数域变成4个字节的整数,并内存映射该整数使其还原成被压缩的浮点型数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510398153.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种嵌入式装置业务逻辑可视化展示方法
- 下一篇:一种软件设计方法及操作系统