[发明专利]基于生成对抗网络局部聚合编码半监督的图像分类方法有效
申请号: | 202010672056.7 | 申请日: | 2020-07-14 |
公开(公告)号: | CN111832650B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 田小林;杨坤;高文星;张艺帆;王露;焦李成 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0475;G06N3/094;G06N3/0464;G06N3/048;G06N3/0895 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 局部 聚合 编码 监督 图像 分类 方法 | ||
1.一种基于生成对抗网络局部聚合编码半监督的图像分类方法,其特征在于,构建由生成器网络和局部聚合编码半监督分类网络组成的生成对抗网络;使用局部聚合编码半监督分类网络特征产生局部聚合编码;对生成对抗网络的生成器网络和局部聚合编码半监督分类网络交替训练;该方法的步骤包括如下:
(1)生成训练集:
选取包含10个类别的至少50000张图片,将每张图片尺寸调整成28×28个像素,对调整后的每张图片进行归一化处理,将归一化后的所有图片组成训练集;
(2)构建生成器网络:
(2a)搭建一个5层生成器网络,其结构依次为:全连接层→第1卷积层→第2卷积层→第3卷积层→第4卷积层;
(2b)设置生成器网络每层的参数:
将全连接层的输出维度设置为256;
将第1至4层卷积层的卷积核个数依次设置为256、128、64、1,卷积核的尺寸依次设置为5×5、5×5、5×5、1×1,卷积步长依次设置为2、2、2、1,卷积层的激活函数均使用LeakyReLU函数;
将第2至4层卷积层使用的Leaky ReLU激活函数的斜率均设置为1;
(3)训练生成器网络:
将尺寸为28×28个像素的至少100个随机噪声输入到生成器网络中,输出尺度为28×28个像素的虚假样本;
(4)构建局部聚合编码半监督分类网络:
(4a)搭建一个6层局部聚合编码半监督分类网络,其结构依次为:输入层→第1卷积层→第2卷积层→第3卷积层→第4卷积层→局部聚合编码层→全连接层;
(4b)设置局部聚合编码半监督分类网络每层的参数:
将第1至4层卷积层的卷积核大小均设置为3×3,卷积层的步长依次设置为2、2、1、1,卷积核的维度依次设置为64、128、256、256,卷积层的激活函数均使用Leaky ReLU函数;
局部聚合编码层的码本数量设置为4,输出向量维度设置为4×256;
全连接层的卷积核个数设置为11,卷积核尺寸设置为256×256;
将第1至4层卷积层使用的Leaky ReLU激活函数的斜率均设置为1;
(5)训练局部聚合编码半监督分类网络:
(5a)从生成器网络输出的虚假样本和数据集中各随机选取50个样本进行混合,将混合后的样本输入到局部聚合编码半监督分类网络中,利用第1至4层卷积层提取图像特征,输出4×256维的视觉描述子;
(5b)建立局部聚合编码本:
将4×256维的视觉描述符输入到局部聚合编码层,生成图像特征和局部聚合编码之间的映射关系,输出4×256维的特征向量;
将4×256维的特征向量依次进行归一化和正则化处理,将处理后的特征向量输入到全连接层,全连接层11个卷积核输出对应的11个类别概率值;其中,所述11个类别概率值包含1个虚假样本类别概率值和10个真实样本类别概率值;
(5c)利用局部聚合编码半监督分类网络损失函数,计算11个类别概率值中最大值的分类损失值;
(5d)利用分类损失值,分别更新局部聚合编码半监督分类网络和生成器网络中每一层的权重值;
(6)判断局部聚合编码半监督分类网络的当前损失值是否接近0.5,若是,执行步骤(7),否则,执行步骤(3);
(7)得到生成对抗网络:
完成局部聚合编码半监督分类网络和生成器网络的交替训练,得到训练好的局部聚合编码半监督分类网络和生成器网络,将训练好的局部聚合编码半监督分类网络和训练好的生成器网络级联成生成对抗网络;
(8)对待分类图像进行分类:
将待分类的图像输入到生成对抗网络中,输出分类结果。
2.根据权利要求1所述的基于生成对抗网络局部聚合编码半监督的图像分类方法,其特征在于,步骤(5c)中所述的局部聚合编码半监督分类网络损失函数如下:
其中,Ls表示局部聚合编码半监督分类网络的分类损失值,Ex,y~Pdata(x,y)表示服从某一分布的数学期望值,中的x表示服从某一分布的真实样本向量,y表示分类任务的类别数值,pdata(x,y)表示服从某一分布的真实样本概率密度函数,log表示对数操作,K表示训练集中图像类别数,第K+1类数据表示生成器网络生成的虚假样本,pmodel(y|x,y<K+1)表示K+1类分类模型概率。
3.根据权利要求1所述的基于生成对抗网络局部聚合编码半监督的图像分类方法,其特征在于,步骤(5d)分别更新局部聚合编码半监督分类网络和生成器网络中每一层权重是由如下公式完成的:
更新局部聚合编码半监督分类网络中每一层权重是由下述公式完成的:
其中,表示局部聚合编码半监督分类网络中第t层更新后的权值,St表示局部聚合编码半监督分类网络中第t层更新前的权值,ξ表示初始值设置为0.001的学习率,ΔSt表示局部聚合编码半监督分类网络中第t层更新前权值的梯度值,α表示值为0.1的系数,Ls表示局部聚合编码半监督分类网络的损失值;
更新生成器网络中每一层权重是由下述公式完成的:
其中,表示生成器网络第t层更新后的权重值,表示噪声向量z服从噪声概率密度函数p(z)的数学期望操作,log表示以10为底的对数操作,W(·)表示求平均值操作,G(zt)表示噪声向量在生成器网络第t层对应的权重向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010672056.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种淡附片生产工艺
- 下一篇:一种基于图像识别的砂石检测方法