[发明专利]一种基于CUDA技术的直写式光刻机图像数据按位压缩方法有效
申请号: | 201610586053.5 | 申请日: | 2016-07-22 |
公开(公告)号: | CN106019858B | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 赵美云 | 申请(专利权)人: | 合肥芯碁微电子装备有限公司 |
主分类号: | G03F7/20 | 分类号: | G03F7/20 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 张祥骞;奚华保 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于CUDA技术的直写式光刻机图像数据按位压缩方法,与现有技术相比解决了CPU的像素压缩技术无法适用于光刻领域特征图像的缺陷。本发明包括以下步骤:数据预处理和初始化;GPU预处理;分配内存;数据复制;启动通用并行计算处理;压缩结果的合并;将压缩之后的数据拷贝至CPU的Host端。本发明通过GPU利用CUDA技术进行并行化处理,提高了计算效率,增加了直写式光刻机的产能,同时降低了数据规模,GPU压缩处理后再将压缩数据传给CPU,减少了对CPU计算能力及传输带宽的依赖。 | ||
搜索关键词: | 一种 基于 cuda 技术 直写式 光刻 图像 数据 压缩 方法 | ||
【主权项】:
1.一种基于CUDA技术的直写式光刻机图像数据按位压缩方法,其特征在于,包括以下步骤:11)数据预处理和初始化,在CPU的Host端申请存放未压缩前图形数据的任务,获取位图图形数据,其宽度为Width,高度为Height,在GPU的Device端申请按位压缩后的压缩数据的任务;12)GPU预处理,在GPU的Device端,根据图形数据的宽、高分配块Block和线程Thread的数量,其中,块Block的数量为图形数据的高;13)分配内存,在GPU的Device端利用CUDA接口函数cudaMalloc()分配内存;14)数据复制,在GPU的Device端利用CUDA接口函数cudaMemcpy()将CPU Host端的Memory中未压缩的图形数据拷贝至GPU的Global Memory中;15)启动通用并行计算处理,CUDA启动多线程并行压缩方法,对图形数据进行压缩处理;所述的启动通用并行计算处理包括以下步骤:151)将图形数据的每行数据拷贝至每个块Block的共享存储区Share Momory中;152)每个块Block中的线程Thread根据所在块Block的数据分配指定的像素数据;153)待所有块Block和其中的线程Thread均分配完毕后,启用Block线程同步函数syncthreads(),开始并行压缩处理;154)并行压缩处理,每个线程Thread处理自己负责的像素点,按像素压缩规则将像素压缩的结果保存在一个字节中;16)压缩结果的合并,将每个线程Thread处理的结果进行合并,获得有效连续数据;17)将压缩之后的数据拷贝至CPU的Host端,利用CUDA提供的接口函数cudaMemcpy(),拷贝GPU的Device端填充好的数据至CPU的Host端的内存区。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥芯碁微电子装备有限公司,未经合肥芯碁微电子装备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610586053.5/,转载请声明来源钻瓜专利网。