[发明专利]一种基于CUDA的引导滤波加速优化方法有效
申请号: | 201510324806.0 | 申请日: | 2015-06-12 |
公开(公告)号: | CN104899840B | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 何凯;王新磊;王晓文;葛云峰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于CUDA的引导滤波加速优化方法,所述引导滤波加速优化方法包括以下步骤:将输入图像p和引导图像I由主机端内存读入全局存储器,通过构建第一内核函数,分别获取输入图像p、引导图像I、图像I*P、图像I*I在邻域窗口的图像邻域均值;构建第二内核函数依次求取图像(I,p)的协方差,引导图像I的方差,进而求取滤波关键参数a和b;调用第一内核函数获得参数a的邻域均值mean_a,参数b的邻域均值mean_b,进而获取最终滤波结果q,将结果保存到对应的全局存储器,传出到主机端内存。该方法利用GPU浮点计算能力、并行计算等方面的优势,在保证图像滤波效果的同时,有效提高了引导滤波算法的执行效率,快速实现了引导滤波算法。 | ||
搜索关键词: | 一种 基于 cuda 引导 滤波 加速 优化 方法 | ||
【主权项】:
1.一种基于CUDA的引导滤波加速优化方法,其特征在于,所述引导滤波加速优化方法包括以下步骤:将输入图像p和引导图像I由主机端内存读入全局存储器,通过构建第一内核函数,分别获取输入图像p、引导图像I、图像I*p、图像I*I在邻域窗口的图像邻域均值;构建第二内核函数依次求取图像(I,p)的协方差,引导图像I的方差,进而求取滤波关键参数a和b;调用第一内核函数求取参数a的邻域均值mean_a,参数b的邻域均值mean_b,进而获取最终滤波结果,将结果保存到对应的全局存储器,传出到主机端内存;实现图像羽化功能时,图像分辨率为946×756,耗时62.3ms,加速度比为60.2;实现图像平滑功能时,图像分辨率为942×659,耗时21.2ms,加速度比为11.0;实现图像增强功能时,图像分辨率为1024×1024,耗时59.7ms,加速度比为16.2;实现flash去噪功能时,图像分辨率为1024×1024,耗时89.7ms,加速度比为10.5;所述通过构建第一内核函数,分别获取输入图像p、引导图像I、图像I*p、图像I*I在邻域窗口的图像邻域均值的步骤具体为:将输入图像p、引导图像I、图像I*p、图像I*I在邻域窗口的图像邻域均值的计算分别转换为图像邻域窗口像素值的求和计算;通过构建第一内核函数分别计算图像邻域窗口像素值的求和;所述通过构建第一内核函数分别计算图像邻域窗口像素值的求和的步骤具体为:采用积分图实现邻域窗口像素值求和,通过第一内核函数中4个核函数进行CUDA并行优化;所述引导滤波加速优化方法还包括:调用第一内核函数中4个核函数,获取邻域窗口像素个数N,并保存到常数存储器;所述引导滤波加速优化方法还包括:采用积分图来实现邻域窗口像素值求和,通过第一内核函数中4个kernel函数进行CUDA并行优化,其具体实现步骤如下:(ⅰ)第1个kernel函数负责并行计算图像第i列从第1行到第j行的像素和,其启动参数为block维度为1024×1,grid维度为1×1;每个线程通过循环调用完成图像中一列数据的计算,循环中采用寄存器保存中间数据,此时数据读取符合全局存储器合并访问;(ⅱ)第1个kernel函数产生的数据需要进行数据边界的处理,第2个kernel函数以行为单位处理数据边界问题,启动参数为block维度为16×16,grid维度为((图像宽度+dimBlock.x‑1)/dimBlock.x)×((图像高度+dimBlock.y‑1)/dimBlock.y)个block,其中dimBlock.x表示线程块在x轴的维度,dimBlock.y表示线程块在y轴的维度;(ⅲ)第3个kernel函数负责并行计算图像第j行从第1列到第i列的像素和;首先对kernel函数输入数据进行矩阵置换,然后调用第1个kernel函数进行计算,在数据存储时采用按列写存储方式;(ⅳ)第3个kernel函数产生的数据也需要进行数据边界的处理,第4个kernel函数以列为单位处理数据的边界问题,启动参数与第2个kernel函数相同,此时输出数据为第1个kernel函数输入图像的邻域窗口像素值和,并将其保存到对应的全局存储器;依次类推,可依次求得引导图像I的邻域均值mean_I,图像I*p的邻域均值mean_Ip,图像I*I的邻域均值mean_II。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510324806.0/,转载请声明来源钻瓜专利网。