[发明专利]一种基于U型空洞残差网络的图像去高光方法有效
申请号: | 202010461626.8 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111709886B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 罗凌杰;陈华华;余帅东 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/0464;G06F3/048;G06N3/084 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空洞 网络 图像 去高光 方法 | ||
1.一种基于U型空洞残差网络的图像去高光方法,包括训练阶段和测试阶段,其特征在于:
所述的训练阶段具体是:
步骤(1).构建去高光网络模型:
所述的去高光网络模型是一个端到端的网络模型,包括两部分:U型结构、空洞残差结构;
所述的U型结构负责提取图像的纹理、边缘特征,并拼接原始高光图像与特征信息,作为空洞残差结构的输入;U型结构包括压缩部分、扩展部分和最底块,最底块用于桥接压缩部分和扩展部分;
所述的压缩部分包含四个压缩块,每个压缩块中存在两个卷积模块层以及一个下采样层;每个卷积模块层依次包括一个卷积层和一个激活层;其中,卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;下采样层采用核尺寸为2×2的最大池化层;压缩部分输入尺寸为256×256×3,经过第一个压缩块后的输出尺寸为256×256×64,经过第二个压缩块后的输出尺寸为128×128×128,经过第三个压缩块后的输出尺寸为64×64×256个,经过第四个压缩块后的输出尺寸为32×32×512;
所述的最底块中存在两个卷积模块层以及一个下采样层;每个卷积模块层依次包括一个卷积层和一个激活层;其中,卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;最底块输入尺寸为32×32×512,输出尺寸为16×16×1024;
所述的扩展部分包含四个扩展块,前三个扩展块中存在两个卷积模块层和一个上采样层,最后一个扩展块中只存在两个卷积模块层;每个卷积模块层依次包括一个卷积层和一个激活层;除最后一个卷积层外的其他卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;上采样层采用尺寸为2×2的卷积核,第一个上采样层位于最底块与扩展块之间,后三个上采样层位于两个扩展块之间;每个扩展块的输入复制并拼接来自于同一高度的压缩块输出;最后通过核尺寸为1×1的最后一个卷积层过滤提取到的特征,与输入的高光图像拼接,得到尺寸为256×256×4的输出;
所述的空洞残差结构包括输入端、空洞残差网络和输出端,负责增强卷积核的视野区以防止物体色彩纹理信息的大量丢失,并利用U型结构提取到的纹理、边缘特征进行无高光图像的预测;
所述的输入端包含两个卷积模块层,每个卷积模块层依次包括一个卷积层、一个激活层和一个下采样层;卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;下采样层采用核尺寸为2×2的最大池化层;输入尺寸为256×256×4,经过第一个卷积模块后的输出尺寸为128×128×32,经过第二个卷积模块后的输出尺寸64×64×64;
所述的空洞残差网络包含八个空洞残差块,每个空洞残差块包含两个卷积模块层;每个卷积模块层依次包括一个卷积层和一个激活层;卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;空洞残差网络输入尺寸为64×64×64,经过第一个空洞残差块后的输出尺寸为64×64×128,经过第二个空洞残差块后的输出尺寸为64×64×128,经过第三个空洞残差块后的输出尺寸为64×64×256,经过第四个空洞残差块后的输出尺寸为64×64×256,经过第五个空洞残差块后的输出尺寸为64×64×512,经过第六个空洞残差块后的输出尺寸为64×64×512,经过第七个空洞残差块后的输出尺寸为64×64×512,经过第八个空洞残差块后的输出尺寸为64×64×512;
所述的输出端包含两个卷积模块层,每个卷积模块层依次包括一个卷积层、一个激活层和一个上采样层;卷积层采用3×3尺寸卷积核,滑动步长为1,零边缘填充尺寸为1;激活层采用ReLU函数;上采样层采用尺寸为2×2的卷积核;输出端的输入尺寸为64×64×512,经过第一个卷积模块后的输出尺寸为128×128×32,经过第二个卷积模块后的输出尺寸为256×256×3;
输出端的最后输出即为预测的无高光图像;
步骤(2).训练去高光网络模型:
(2-1).采用正态分布初始化去高光网络模型中所有权值参数;
(2-2).构建训练数据集:收集用于训练的彩色图像,将所有图像缩放大小为256×256,并扩充数据集,扩充数据集采用旋转或翻转方法;然后从集合中随机选择20~50%的图像组成验证集,剩余的图像组成训练网络的训练数据集;
(2-3).训练网络参数:首先设定学习率为α,采用指数衰减,每β次迭代衰减为原来的γ,每δ次迭代计算一次验证集损失,批尺寸为η;定义损失函数为:n为像素点总数,n=65536为像素点总数,yi和yi′分别为第i个像素点真实的和预测的无高光强度值;y和y′分别为真值图和无高光预测图,SSIM为结构相似性指数;
然后采用误差反向传播算法迭代更新网络中的各项权值参数;每迭代M_n次后判断当前模型预测输出与真值之间的损失函数s是否小于设定阈值th,th=4~8:若sth,则停止迭代,训练结束,输出训练得到的目标检测模型及其对应参数;若s≥th,继续迭代训练,当总的迭代次数达到设定最高次数Iter_max时,训练结束;
所述的测试阶段具体是:模型为端到端模型,若输入图像大小不为256×256,首先将图像缩放至256×256,然后将测试图像输入到模型当中,输出即为预测的无高光图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010461626.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序