[发明专利]基于改进的二元闭环神经网络的LOGO图案重建方法有效
申请号: | 202010710204.X | 申请日: | 2020-07-22 |
公开(公告)号: | CN111932454B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 雒鹏程;胡更生 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 二元 闭环 神经网络 logo 图案 重建 方法 | ||
1.基于改进的二元闭环神经网络的LOGO图案重建方法,其特征在于包括以下步骤:
步骤一、构建二元闭环神经网络的训练集
获取若干分辨率为W×H的原始高分辨率LOGO图案,进行两次图像缩放变换,得到尺寸为W×H的低分辨率图像,去噪后作为训练集的输入项;对应去噪后原始高分辨率LOGO图案作为训练集的输出项;
步骤二、构建二元闭环神经网络:
2-1构建二元闭环神经网络的原始映射:
原始映射依次由下采样层、卷积层、残差通道注意力模块、亚像素卷积重构层、转换色彩空间层、图像边缘计算层、图像感知损失计算层、图像边缘损失计算层构成;其中残差通道注意力块主要由池化层,上采样层,下采样层以及混合层构成;
2-2构建二元闭环神经网络的回归映射:
回归映射依次由下采样层、卷积层、残差通道注意力模块、亚像素卷积重构层、图像感知损失计算层构成;
步骤三、利用训练集进行BCLNN模型的训练
步骤四、LOGO图案的复原及重建
4-1将待重建LOGO图像使用DATALOADER函数导入PYTHON环境中;
4-2加载已经训练好的对应的BCLNN模型,将上述待重建LOGO图像作为输入图像输入模型中,复原重建得到重建图像。
2.如权利要求1所述的方法,其特征在于步骤一具体如下:
步骤A、模型训练的数据收集:
1.1收集n张高分辨率LOGO图案,n350,高分辨率尺寸为W×H,图片均为纯色背景,并标记为A组;
1.2将1.1中收集的这些图片进行图像缩放变换,得到分辨率为1/3*W×1/3H的低分辨率图像,并标记为B组;其中图像缩放变换采用双三次插值方法,采用双三次内插基函数作为基函数,双三次插值计算按公式(1)进行:
f(i+u,j+v)=ABC (1)
其中,A、B、C均为矩阵,形式如下:
A=[s(v+1) s(v) s(1-v) s(2-v)] (2)
(i,j):原图像的像素坐标,其中,i为横坐标值,j为纵坐标值,i、j均为非负整数;
f(i,j):原图像的像素灰度值;
(i+u,j+v):缩放变换后新图像的像素坐标;
f(i+u,j+v):缩放变换后新图像的像素灰度值;
u:沿横坐标方向,原图像像素坐标的横坐标i离新图像像素坐标(i+u,j+v)的距离;
v:沿纵坐标方向,原图像像素坐标的纵坐标j离新图像的像素坐标(i+u,j+v)的距离;
|x|:图像像素沿x方向离原点的距离;
s(x):sin(π·x)/x的逼近多项式,为插值核;
步骤B.数据集的预处理,生成模型的训练集:
2.1将步骤1.2低分辨率图像进行二次图像缩放变换,得到尺寸为W×H的图像;其中图像缩放变换采用双三次插值方法,采用双三次内插基函数作为基函数,双三次插值计算按公式(1)进行:
2.2将步骤2.1二次缩放变换后B组图像作为训练集的输入集合,步骤1.1A组图像作为训练集的输出集合,输入集合与输出集合组成完整的训练集;
2.3将步骤2.2中得到的训练集中图像进行中值滤波处理,得到去噪图像,由matlab语言编写实现;具体如下:
a)将图像的R,G,B三通道分离;
b)对每个通道中的每个像素,把其邻域中的像素按灰度级进行排序,选择该组的中间值作为这个像素的输出值,通常选择3×3窗口大小的邻域;
c)将计算中值后的三个通道整合,输出去噪后图像;
2.4将步骤2.3中得到的去噪后图像作为二元闭环神经网络的训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010710204.X/1.html,转载请声明来源钻瓜专利网。