[发明专利]基于深度学习的图像去失焦模糊方法有效
申请号: | 201911099357.9 | 申请日: | 2019-11-09 |
公开(公告)号: | CN111091503B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 颜波;王沛晟;王峻逸;孙玉齐 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 图像 去失焦 模糊 方法 | ||
1.一种基于深度学习的图像去失焦模糊方法,其特征在于,具体步骤如下:
(一)建立去失焦模糊数据集
通过拍摄或添加随机模糊等方式构建一个去失焦模糊数据集,使得每组数据包含一张清晰的图像作为原图,以及若干张模糊的图像作为清晰图所对应的模糊图;
(二)训练去失焦模糊深度神经网络
随机从步骤(一)中的去模糊数据集中选择一张模糊图像Iblur,并随机裁剪出一个256×256的区域后输入神经网络,得到一个3×256×256大小的去模糊图像Pdeblur;将去模糊图像Pdeblur和去模糊数据集中与之对应的清晰图区域Pclear计算非对齐损失Loss,通过反向传播算法更新深度神经网络模型中的参数;重复步骤(2)直至去失焦模糊深度神经网络收敛;
(三)将失焦模糊图像转化为张量
将一张存在失焦模糊的RGB图像视为3×H×W的张量T,将张量T除以256得到取值介于0-1之间的张量T′;
(四)将张量输入深度神经网络
将步骤(三)中的张量T′输入步骤(二)中训练的去失焦模糊深度神经网络,得到结果张量Tresult;
(五)将结果张量恢复为图像
将步骤(四)中的结果张量Tresult乘以256并进行取整,取整后的张量视为去失焦模糊后的RGB图像。
2.根据权利要求1所述的基于深度学习的图像去失焦模糊方法,其特征在于,步骤(一)中,所述通过拍摄构建一个去失焦模糊数据集,具体做法为:
真实场景下拍摄RSDBR数据集;训练集共有128组数据,每组数据包含一张清晰图像与2-5张失焦模糊图像;测试集共有60组数据,每组数据包含一张清晰图像与一张失焦模糊图像;所有图像的分辨率均为3216×2136像素;
所述通过添加随机模糊等方式构建一个去失焦模糊数据集,是使用291张高分辨率的图像作为清晰图,通过手动添加模糊来构造失焦模糊图,从而形成一对训练数据,其具体步骤如下:
(1)清晰图过大时,将清晰图等比例缩小到短边为1024像素;
(2)随机切出512×512像素大小的区域R;
(3)在区域R上随机选择一种模糊方式:
(3.1)整个区域R添加模糊核半径为2到17像素的均匀圆形模糊;
(3.2)随机生成一条高次曲线将区域R分成两部分,每部分分别添加一个如步骤3.1所述的随机半径的圆形模糊;
(3.3)随机生成一条高次曲线将区域R分成两部分,一部分添加一个如步骤3.1所述的随机半径的圆形模糊,另一部分保持清晰;
(3.4)随机生成一条高次曲线将区域R分成两部分,每部分分别添加一个模糊核大小和方差随机的高斯模糊;
(4)在模糊图上随机添加一个微小的高斯噪声提升鲁棒性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911099357.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自生二氧化碳压裂支撑剂及其制备方法
- 下一篇:共享支付设备及自助设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序