[发明专利]一种基于生成对抗网络的图像多样性增强方法与系统有效
申请号: | 202111561049.0 | 申请日: | 2021-12-20 |
公开(公告)号: | CN113947706B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 唐彰国;张健;李焕洲;王涵 | 申请(专利权)人: | 四川师范大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/762;G06V10/774;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 成都为知盾专利代理事务所(特殊普通合伙) 51267 | 代理人: | 李汉强 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 图像 多样性 增强 方法 系统 | ||
1.一种基于生成对抗网络的图像多样性增强方法,应用于装有Tensorflow框架的Windows系统设备,其特征在于,包括:
S1:搭建一个生成对抗网络模型,包括聚类模块、具有分类导向的损失函数、判别器模块和生成器模块;
S2:将采集的图像数据形成原始图像数据集,并对所述原始图像数据集做归一化预处理,并定义优化器和损失函数;
所述S2定义的损失函数为编码长度函数和辛普森多样性指数相结合,具体为:
S2.1:定义图像的编码长度函数公式为:
其中,m和D分别为数据的尺寸,对应为图片的长与宽,I为上层网络残差,X为图像张量本身,同理
S2.2:定义辛普森多样性指数公式为:
其中
当一个群落中,每个种群的数量相同时,得到辛普森多样性指数的另一种形式,其公式为:
其中,S代表,这个群落中的物种的种类数;
S2.3:将辛普森多样性指数和编码长度函数相结合,得到具有分类导向的损失函数,损失函数公式为:
其中,α是一个阈值,取值范围为(0,1),Ld-loss代表的是判别器损失值,Lg-loss是生成器损失值,E代表期望,x~Ptag代表的是x是tag集合中的数据,SPI是辛普森多样性指数,λ是一个范围为(0,1)的阈值,L(x,ε)代表的是编码长度函数;
S3:使用Tensorflow框架的函数生成噪声,将生成的噪声放入生成器模块,生成对应的图像对抗样本;
S4:所述图像对抗样本进入聚类模块,然后聚类模块对所述图像对抗样本进行聚类,并得出聚类数值;
S5:所述原始图像数据集和所述图像对抗样本进入判别器模块,判别器模块根据所述原始图像数据集对所述图像对抗样本进行判断,输出一个判断结果;
S6:根据判断结果,基于所述聚类数值,利用S2定义的损失函数,计算所述生成器模块的损失值和所述判别器模块的损失值,并通过反向传播的训练方式来提升生成器模块和判别器模块的性能,并获取判别器模块的生成图像作为图像多样性增强样本;
S7:然后循环S3-S6,直到生成器模块和判别器模块的训练次数达到预设的训练阈值,循环结束,生成最终的图像多样性增强数据集。
2.根据权利要求1所述的一种基于生成对抗网络的图像多样性增强方法,其特征在于,所述S1搭建判别器模块和生成器模块具体为:
S1.1:搭建一个八层神经网络结构的判别器模块:利用Keras框架中的Conv2D函数搭建四层卷积神经网络,然后使用BatchNormalization函数搭建两层BN层,以及最后的一个Flatten层和一个全连接层;
S1.2:搭建一个七层神经网络结构的生成器模块:首先搭建一个作为噪声输入大小为N×N的全连接层,再利用Keras框架中的Conv2DTranspose函数搭建四层反卷积神经网络层,然后使用BatchNormalization函数搭建两层BN层,最后一层反卷积神经网络层作为生成器模块的输出。
3.根据权利要求2所述的一种基于生成对抗网络的图像多样性增强方法,其特征在于,S3具体为:
S3.1:生成一个范围在[0-1]之间且大小为N×N的噪声,输入到生成器模块的全连接层中;
S3.2:生成器模块将输入的N×N噪声,进行一个重组操作,将其维度从二维张量改变为三维张量,然后进行反卷积操作;
S3.3:最后一层反卷积神经网络层输出生成的对抗样本图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川师范大学,未经四川师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111561049.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于时空特征的关系收敛方法、装置、设备及存储介质
- 下一篇:一种混合器