[发明专利]一种基于半预测滤波的快速图像散景渲染方法有效
申请号: | 202110914290.0 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113810597B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 颜成钢;陈泉;马立栋;郑博仑;孙垚棋;张继勇;李宗鹏 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;G06T3/00;G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 预测 滤波 快速 图像 渲染 方法 | ||
1.一种基于半预测滤波的快速图像散景渲染方法,其特征在于,步骤如下:
步骤1:数据集制作;
步骤2:构建基于半预测滤波的快速图像散景渲染网络模型;
步骤3:训练基于半预测滤波的快速图像散景渲染网络模型;
步骤4:经过训练的神经网络模型接收需要进行散景渲染处理的图片,完成散景渲染处理后将图片输出;
步骤1具体方法如下:
步骤1.1:通过单反相机拍摄获取不同场景下拍摄的数据,所述的不同场景下拍摄的数据均为一对图片,即分别为单反相机拍摄的全聚焦图片Iorg和单反相机利用大光圈真实拍摄的具有散景渲染效果的图片Igt;其中全聚焦图片Iorg作为模型训练过程中的输入图像数据,而具有真实散景渲染效果的图片Igt作为模型训练过程中的用于与模型输出图像进行对比的对比数据;
步骤1.2:对数据集的所有图片利用双三次线性插值方法插值为高1024×宽1472的尺寸;
步骤1.3:坐标图制作;对步骤1.2处理后的全聚焦图片Iorg进行坐标赋值,具体计算方法如下:
其中,X代表图片高维度对应的像素点坐标,Y代表图片宽维度对应的像素点坐标;将X和Y的信息与全聚焦图片Iorg进行结合,重新构建一张5通道的全聚焦图片Iorg+c作为网络模型的最终输入图片;
步骤2具体方法如下:
步骤2.1:基于半预测滤波的快速图像散景渲染任务理论推导;假设输入是一张全聚焦图片Iorg+c,利用显著性检测算法将全聚焦图片Iorg+c分成两部分,包含图片中显著性特征部分Ifocus以及图片的背景特征Idefocus;利用半滤波模糊算法将背景区域图片Idefocus模糊处理,得到具有模糊背景的图片Iblur,半滤波模糊算法将显著性特征部分Ifocus进行保留,最后将具有模糊背景的图片Iblur与显著性特征部分Ifocus融合,得到所需要的具有散景渲染的图片Ibokeh;图像散景渲染任务的理论模型用公式表示如下:
其中表示显著性检测算法;表示半滤波模糊算法;
步骤2.2:构建基于半预测滤波的快速图像散景渲染网络;
基于半预测滤波的快速图像散景渲染网络包括注意力模块,残差模块,半滤波核模块和图像生成模块;其中注意力模块用于检测输入全聚焦图片Iorg+c中的显著性特征,用于辅助后续限制性预测滤波模块的工作;残差模块用于对输入数据进行深层的特征增强;半滤波核模块用于生成需要的滤波核,用于对输入图像进行滤波操作,模糊图片部分内容从而产生散景渲染效果,其中滤波核由网络生成的自适应滤波核以及少量的人工定义参数的Gabor滤波核组成,网络生成的自适应滤波核用来自适应的模糊输入图像,人工定义参数的Gabor滤波核用来保留并增强图像的显著性区域细节以及边缘细节;图像生成模块用于生成需要使用半滤波核模块生成的滤波核进行滤波的图片;
完整网络分为2个分支,每个分支处理不同尺度的信息;网络的初始输入为步骤1.3生成的全聚焦图片Iorg+c;分支1包含残差模块,半滤波核模块和图像生成模块,而分支2包含注意力模块,半滤波核模块和图像生成模块;为了增强不同分支之间的信息关联度,分支2的输入由均经过下采样的分支1的中间信息和全聚焦图片信息组成,而分支2的输出结果会反馈到分支1的图像生成模块,用于指导图像生成模块的运算;
残差模块具体结构:残差模块的输入特征图Xres依次经过3个卷积核数量为64,卷积核大小为3*3的卷积层后得到输出特征图X'res;最后将输出X'res和输入Xres逐元素相加,得到残差模块的最终输出特征图Xres-out;其中所有的卷积层后都连接一个ReLU非线性激活函数;
注意力模块具体结构:注意力模块的输入特征图Xatt的尺寸为高H*宽W*通道C;注意力模块分成上up,中mid,下down三个分支,输入特征图Xatt经过up分支的卷积核数量为64,卷积核大小为3*3的卷积层后进行Reshape操作,得到形状为HW*64的特征图Xup;输入特征图Xatt经过mid分支的卷积核数量为64,卷积核大小为3*3的卷积层后进行Reshape操作,得到形状为64*HW的特征图Xmid;将特征图Xup与特征图Xmid进行矩阵乘法运算后,采用Softmax函数进行激活,得到形状为HW*HW的特征图Xact;输入特征图Xatt经过down分支的卷积核数量为64,卷积核大小为3*3的卷积层后进行Reshape操作,得到形状为HW*64的特征图Xdown;将特征图Xact与特征图Xdown进行矩阵乘法运算后,再次进行Reshape操作,得到形状为H*W*64的特征图Xfinal;特征图Xfinal经过3个卷积核数量为64,卷积核大小为3*3的卷积层后,与输入特征图Xatt逐元素相加,得到注意力模块最终的输出特征图Xatt-out;其中所有的卷积层后都连接一个ReLU非线性激活函数;
半滤波核模块具体结构:半滤波核模块的输入特征图Xfilter的尺寸为高H*宽W*通道C;输入特征图Xfilter经过一个滤波核数量均为64的残差模块,得到深层特征信息Xdeep;在依次经过卷积核数量为64,卷积核大小为3*3的卷积层和倍数为2的上采样层,得到需要的生成滤波的特征图X'deep,其尺寸为2H*2W*64;
将特征图X'deep按照通道维度进行划分,分成尺寸为2H*2W*48的特征图XA和尺寸为2H*2W*16的特征图XB;特征图XA用于生成自适应滤波核,即特征图XA依次经过卷积核数量为k2,卷积核大小为3*3的卷积层和Softmax激活函数,得到尺寸为2H*2W*k2自适应滤波核Xadp-f,其中k为预定义的滤波核尺寸;特征图XB用于组合生成固定滤波核参数的边缘滤波核Gabor滤波核,即特征图XB与给定参数的16个Gabor滤波核进行自定义滤波操作,对16个Gabor滤波核进行线性组合,得到所需要的尺寸为2H*2W*k2边缘滤波核Xgabor-f,用于快速增强图片的边缘信息以变保留,其中16个Gabor滤波核包含8个方向,同方向的Gabor滤波核又包含2个Sigma参数,所以16个Gabor滤波核参数各不相同;最后将自适应滤波核Xadp-f和边缘滤波核Xgabor-f进行逐元素相加,得到最终需要的半滤波核Xfilter-out;
图像生成模块具体结构:图像生成模块包含三个输入,同尺度的输入特征图X1,低尺度的经过上采样操作的输入特征图X2,输入的半滤波核模块生成的半滤波核Xfilter-out;输入特征图X1依次经过卷积核数量为3,卷积核大小为3*3的卷积层和倍数为2的上采样层,将输出结果与输入特征图X2进行逐元素相加,得到最终需要进行滤波操作的尺寸为H*W*3的特征图Xgen;将半滤波核Xfilter-out和特征图Xgen进行自定义滤波核的卷积操作,得到最终的尺寸为H*W*3的特征图Xout,特征图Xout即为所需要的经过散景渲染处理的图片;
步骤3具体方法如下:
网络模型的训练方式如下:
首先输入步骤1.3中制作的5通道全聚焦图片Iorg+c;然后,通过显著性检测模块和限制性预测滤波模块进行图像的显著性特征保留和背景模糊处理;最后,利用损失函数不断优化模型输出的具有散景渲染的图片Ibokeh,使其逐渐相似于步骤1构建的数据集中的具有真实散景渲染效果的图片Igt;
训练过程中,损失函数L采用L1函数和LS函数的结合,提高模型输出图片Ibokeh与对比图片Igt之间的结构相似性,并利用深度学习的反向传播,不断减小模型输出图片Ibokeh和对比图片Igt之间的差异,从而实现模型输出的具有散景渲染的图片Ibokeh的优化,其具体表示为:
L=L1(Ibokeh,Igt)+LS(Ibokeh,Igt)
其中L1(Ibokeh,Igt)表示模型输出的具有散景渲染的图片Ibokeh与对比图片Igt的重构函数,而LS(Ibokeh,Igt)表示模型输出的具有散景渲染的图片Ibokeh与对比图片Igt的轮廓相似函数,损失函数表达式如下:
其中Sobel代表对图片进行水平和竖直方向的梯度计算,用于计算图片内容的轮廓结构,N代表图片的像素点个数总和,即图片的宽W×高H;
步骤4具体方法如下:
加载由步骤2训练完成的散景渲染网络模型权重,更新模型中的参数;其次,将步骤1.2中修改过尺寸的全聚焦图片Iorg+c作为输入数据传入到散景渲染的网络模型中,输入数据依次经过显著性检测模块和限制性预测滤波模块,得到具有散景渲染效果的模型输出图片Ibokeh。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110914290.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于区块链的六氟化硫回收利用管理系统及方法
- 下一篇:一种银铅锌矿选矿方法