[发明专利]基于交互对抗学习的全聚焦图像生成方法在审
申请号: | 202110911218.2 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113610732A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 赵文达;魏菲;徐从安;姚力波;刘瑜;何友;卢湖川 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/13;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 交互 对抗 学习 聚焦 图像 生成 方法 | ||
1.一种基于交互对抗学习的全聚焦图像生成方法,其特征在于,步骤如下:
该基于交互对抗学习的全聚焦图像生成方法分为非聚焦模糊检测和全聚焦图像生成两个阶段;
第一阶段,非聚焦模糊检测采用镂空-填充交互学习的方式
在非聚焦模糊检测阶段,采用VGG16的前13层作为编码器,以双线性上采样结合卷积层作为解码器,构造基础网络来提取非聚焦特征,从而生成非聚焦模糊检测图;
E1-E5这5个卷积块和VGG16的前13层结构相同,由卷积层和池化层组成,是网络的特征编码器;E1的输入是一幅3×320×320的三通道RGB图像,E5的输出是512×20×20的特征;D1-D4这4个解码块,每个解码块都是由两层卷积和双线性上采样层组成;对每个解码块的输出特征进行1×1的卷积降维和Sigmoid归一化,获得边缘或区域检测结果再进行监督;考虑到区域监测的单任务中,网络提取的特征是偏区域的,边缘检测的任务中,网络提取的特征是偏边缘的;因此采用双支路交互的方式,交互方式如公式(1-1)所示,在两个支路网络中同时进行区域和边缘这两个任务,在中间过程进行双任务特征的镂空-填充交互,并在每一条支路的解码器中依次顺序重复镂空和填充的过程,对区域特征进行镂空能指导边缘特征的自身优化,对边缘特征进行填充有助于区域特征减少噪声;在各个阶段辅以监督,更新整体网络参数,从而提高网络提取特征的能力,提升非聚焦检测效果;
其中,Di_E和Di_R分别表示第i个边缘和区域的解码块,X表示解码块的输入特征,Y表示编码块的输出特征,表示特征图拼接,每一个检测结果都对应边缘或区域的监督;
第二阶段,全聚焦图像生成采用对抗学习的方式
得到模糊检测图后,进入全聚焦图像生成阶段,以12个卷积层作为生成器,以7个卷积层结合全局平均池化作为鉴别器,从而构造生成对抗网络来生成全聚焦图像,生成过程如公式(1-2)所示:
其中,表示第i个区域解码块所输出的非聚焦模糊检测图像,Gi(·)表示第i个全聚焦图像生成器,Ii表示其输出的全聚焦图像;
在网络训练阶段,为减小输出异常值的影响,非聚焦模糊区域检测结果使用的是均方差损失函数:
其中,gdk表示非聚焦模糊检测图中第k个像素对应的真值,ydk表示其预测值,N表示图像中像素总个数;
非聚焦模糊边缘检测结果使用的是二分类交叉熵损失函数:
其中,gek表示非聚焦模糊边缘检测图中第k个像素对应的真值,yek表示其预测值,N表示图像中像素总个数;
全聚焦图像生成结果使用的是生成对抗损失函数:
其中,Di(·)表示鉴别器,Gi(·)表示全聚焦图像生成器,zc为全聚焦图像样本,Zc为全聚焦图像集合,其中zc∈Zc;zs为生成器输出的全聚焦图像样本,Zs为生成器输出的全聚焦图像集合,其中zs∈Zs;表示取整个样本集合的平均值;
最终网络总的损失函数为:
其中,λ1、λ2、λ3用于平衡三种损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110911218.2/1.html,转载请声明来源钻瓜专利网。