[发明专利]一种基于深度学习网络的无参考图像模糊程度估计方法有效
申请号: | 201710909377.2 | 申请日: | 2017-09-29 |
公开(公告)号: | CN109598695B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 岳涛;索津莉;袁飞;黄华;陈鑫 | 申请(专利权)人: | 南京大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T9/00 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李媛媛 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 网络 参考 图像 模糊 程度 估计 方法 | ||
1.一种基于深度学习网络的无参考图像模糊程度估计方法,其特征在于,包括如下步骤:
步骤1,生成训练数据:对图像进行下采样,截取图像中有结构或有纹理的清晰图像块,用高斯模糊核卷积清晰图像块生成模糊图像块;
步骤2,用清晰图像块和模糊图像块分别训练清晰感知网络和模糊感知网络这两个稀疏自编码器;分别提取清晰和模糊的有效特征,并对输入进行解码重建;
步骤3,将清晰感知网络和模糊感知网络提取的特征作为联合感知网络的输入,用模糊图像块训练联合感知网络,获取模糊的本质特征;
步骤4,训练非线性特征映射和回归网络,将步骤3的本质特征映射到模糊程度上;
步骤5,对整个网络进行微调,优化所有参数。
2.根据权利要求1所述的一种基于深度学习网络的无参考图像模糊程度估计方法,其特征在于,所述步骤2中,提取清晰和模糊的有效特征并对输入进行解码重建的具体过程为:
建立两个全连接的三层网络,包含输入层、隐藏层和输出层;对输入图像块x,隐藏层提取的特征和输出层重建分别是
h=f(W1*x+b1)
x'=f(W2*h+b2)
这里f(x)=1/(1+exp(-x))是非线性函数,W1,W2代表权重,b1,b2代表偏移;
使用反向传播方法,减小重构误差来调整权重W1、W2和偏移b1、b2的值;网络的训练等效为下面的优化问题:
SP(ρ||ρj)=ρlog(ρ/ρj)+(1-ρ)log((1-ρ)/(1-ρj))
这里xi和xi'分别表示输入的图像块和输出的重建结果,p表示输入图像块的个数,SP(ρ||ρj)表示稀疏惩罚项,ρ示隐藏单元的平均激活度,ρj表示稀疏水平,β控制稀疏惩罚项的权重;
给定清晰图像块xS和模糊图像块xB作为输入,提取的清晰特征和模糊特征分别为:
解码重建分别为:
参数W1S,代表清晰感知网络,参数W1B,代表模糊感知网络,两个子网络被两组不同数据训练出来了。
3.根据权利要求2所述的一种基于深度学习网络的无参考图像模糊程度估计方法,其特征在于,所述步骤3的具体过程为:
将预训练的清晰感知网络和模糊感知网络联合在一起,提取模糊中的内在特征,这是一个对清晰和模糊的不同特征的非线性映射,将联合感知网络的第一层的输出定为
因此联合感知网络的操作是
这里h3是联合感知网络的输出层,W3表示权重,b3表示偏置;
为了训练联合感知网络,固定参数W1S,W1B和通过减小h3和yR间的损失,优化剩余参数W3和b3;其中,损失函数是:
这里n是训练图像块的数量,实输出yR是模糊输入和原始清晰图像块间残渣,代表它们之间的丢失信息;损失函数通过反向传播算法达到最小。
4.根据权利要求3所述的一种基于深度学习网络的无参考图像模糊程度估计方法,其特征在于,所述步骤4的具体过程为:
多层神经网络实现非线性特征映射和回归,在非线性特征映射中,每个特征映射层的操作是:
hi=f(Wi*hi-1+bi)
这里i=4,5,hi是每个特征映射层的输出向量,Wi、bi分别是特征映射层的权重和偏置;
最后的回归层是:
DB=max(0,W6h5+b5)
这里采用Relu作为激活函数;
训练整个网络,估计所有的网络参数{Wi,bi},i=1,2,...,6,将参数{W1,W2,W3,b1,b2,b3,}初始化为相应的预训练的参数,其余的参数随即初始化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710909377.2/1.html,转载请声明来源钻瓜专利网。