[发明专利]基于特征图最近邻替换的卷积神经网络的图像填充系统有效
申请号: | 201711416650.4 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108171663B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 左旺孟;颜肇义;李晓明;山世光 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/04 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 宋诗非 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于特征图最近邻替换的卷积神经网络的图像填充系统,属于图像填充技术领域,解决了现有图像填充方法无法快速地获得整体语义一致且具有良好清晰度的填充图像的问题。所述系统:生成网络对待填充图像先编码后解码,得到已填充图像。生成网络的解码器包括N个反卷积层,对于第一反卷积层~第N‑1反卷积层中的任意M个反卷积层,生成网络基于每个反卷积层的输出结果和该反卷积层对应的卷积层的输出结果,并采用特征图最近邻替换的方式得到附加特征图,并将每个反卷积层的输出结果、该反卷积层对应的卷积层的输出结果和附加特征图共同作为下一反卷积层的输入对象。判别网络用于判断已填充图像是否为待填充图像对应的真实图像。 | ||
搜索关键词: | 基于 特征 近邻 替换 卷积 神经网络 图像 填充 系统 | ||
生成网络包括编码器和解码器,编码器包括N个卷积层,解码器包括N个反卷积层,N≥2;
生成网络通过对待填充图像先编码后解码的方式,得到已填充图像;
对于第一反卷积层~第N‑1反卷积层中的任意M个反卷积层,生成网络基于每个反卷积层的输出结果和该反卷积层对应的卷积层的输出结果,并采用特征图最近邻替换的方式得到附加特征图,并将每个反卷积层的输出结果、该反卷积层对应的卷积层的输出结果和得到的附加特征图共同作为下一反卷积层的输入对象;
判别网络用于判断已填充图像是否为待填充图像对应的真实图像,进而对生成网络的权重学习进行约束。
2.如权利要求1所述的基于特征图最近邻替换的卷积神经网络的图像填充系统,其特征在于,编码器包括卷积层E1~卷积层E8,解码器包括反卷积层D1~反卷积层D8;待填充图像为卷积层E1的输入对象;
对于卷积层E1~卷积层E8,前者的输出结果在依次经批规范化和Leaky ReLU函数激活后,作为后者的输入对象;
卷积层E8的输出结果在依次经批规范化和Leaky ReLU函数激活后,作为反卷积层D1的输入对象;
反卷积层D1的输出结果在经ReLU函数激活后作为反卷积层D2的第一输入对象;
对于反卷积层D2~反卷积层D8,前者的输出结果在依次经ReLU函数激活和批规范化后,作为后者的第一输入对象;
反卷积层D2~反卷积层D8的第二输入对象依次为卷积层E7~卷积层E1的依次经批规范化和Leaky ReLU函数激活后的输出结果;
经Tanh函数激活后的反卷积层D8的输出结果为已填充图像;
卷积层E1用于对输入对象进行64个4*4、步长为2的卷积操作;
卷积层E2用于对输入对象进行128个4*4、步长为2的卷积操作;
卷积层E3用于对输入对象进行256个4*4、步长为2的卷积操作;
卷积层E4~卷积层E8均用于对输入对象进行512个4*4、步长为2的卷积操作;
反卷积层D1~反卷积层D4均用于对输入对象进行512个4*4、步长为2的反卷积操作;
反卷积层D5用于对输入对象进行256个4*4、步长为2的反卷积操作;
反卷积层D6用于对输入对象进行128个4*4、步长为2的反卷积操作;
反卷积层D7用于对输入对象进行64个4*4、步长为2的反卷积操作;
反卷积层D8用于对输入对象进行3个4*4、步长为2的反卷积操作;
生成网络基于反卷积层D5的输出结果和卷积层E3的输出结果,并采用特征图最近邻替换的方式得到附加特征图,并将该附加特征图作为反卷积层D6的第三输入对象。
3.如权利要求2所述的基于特征图最近邻替换的卷积神经网络的图像填充系统,其特征在于,生成网络基于反卷积层D5的输出结果和卷积层E3的输出结果,并采用特征图最近邻替换的方式得到附加特征图的具体过程为:选取一个特征值均为0的待赋值特征图,该特征图与反卷积层D5的输出特征图和卷积层E3的输出特征图具有相等的通道数和相同的空间大小;
计算得到反卷积层D5的输出特征图的掩膜区域和卷积层E3的输出特征图的非掩膜区域,并同时将所述掩膜区域和所述非掩膜区域切割为多个特征块;
多个特征块均为长方体,其尺寸为C*h*w,其中,C、h和w分别为反卷积层D5的输出特征图的通道数、长方体的长度和长方体的宽度;
对于所述掩膜区域中的每个特征块p1,选取所述非掩膜区域的多个特征块中与特征块p1距离最近的特征块p2;
选取待赋值特征图中的待赋值区域,该待赋值区域与特征块p1在反卷积层D5的输出特征图中的位置一致;
将特征块p2的特征值赋予所述待赋值区域。
4.如权利要求3所述的基于特征图最近邻替换的卷积神经网络的图像填充系统,其特征在于,特征块p2与特征块p1的余弦距离最近。5.如权利要求4所述的基于特征图最近邻替换的卷积神经网络的图像填充系统,其特征在于,输出特征图的掩膜区域和非掩膜区域的计算方式为:给定一幅掩码图像来替代待填充图像,掩码图像与待填充图像的尺寸相同,通道数为1,特征值为0或1;
0表示该特征点在待填充图像上的相应位置为非待填充点;
1表示该特征点在待填充图像上的相应位置为待填充点;
通过卷积网络来计算掩码图像的特征图的掩膜区域和非掩膜区域,该卷积网络包括第一卷积层~第三卷积层;
掩码图像为第一卷积层的输入对象;
对于第一卷积层~第三卷积层,前者的输出结果为后者的输入对象;
第一卷积层~第三卷积层均用于对输入对象进行1个4*4、步长为2的卷积操作;
第三卷积层的输出结果为掩码图像的特征图,其尺寸为32*32,通道为1;
对于掩码图像的特征图,当其一个特征值大于设定的阈值时,判定该特征点为掩膜点,否则,判定该特征点为非掩膜点;
掩码图像的特征图的掩膜区域为掩膜点的集合,掩码图像的特征图的非掩膜区域为非掩膜点的集合;
输出特征图的掩膜区域与掩码图像的特征图的掩膜区域相等,输出特征图的非掩膜区域与掩码图像的特征图的非掩膜区域相等。
6.如权利要求5所述的基于特征图最近邻替换该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711416650.4/,转载请声明来源钻瓜专利网。