[发明专利]一种基于生成对抗网络的通用扰动生成方法有效
申请号: | 202010254686.2 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111461307B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 何琨;陈晶;郑宏毅;杜瑞颖 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 通用 扰动 方法 | ||
1.一种基于生成对抗网络的通用扰动生成方法,其特征在于,包括以下步骤:
步骤1:使用生成网络生成通用扰动,将扰动与任意图片数据集结合得到对抗样本;
步骤2:将数据集中原始样本与步骤1中得到的对抗样本输入判别网络得到输入样本为真实样本的概率值,根据判别网络目标函数计算损失值,并进行反向传播,优化判别网络判别对抗样本能力;
步骤3:将步骤1中得到的对抗样本输入被攻击模型得到样本分类概率值,输入判别网络得到对抗样本概率值,根据生成网络目标函数计算损失值,并进行反向传播,优化生成网络生成通用扰动能力;
其中,计算生成网络类别约束损失值Lc、判别网络损失值LGAN、像素级约束损失值Lpix,得到生成网络损失值Lg=Lc+βLGAN+γLpix,其中β、γ为权重值;
Lc根据目标攻击和非目标攻击可选择不同目标函数;非目标攻击下,对于数据集X中的样本x,被攻击模型f(x)的预测结果标签为c0,对抗样本只需被分类为非原始标签即可,其目标就是使除c0外任意标签的置信度大于c0,此时类别约束的损失函数定义为Lnt;目标攻击下,先选定攻击标签c,通用扰动的目的是使标签c的置信度大于其他标签,此时类别约束损失函数定义为Lt;则类别约束损失值Lc取目标攻击下的Lc=Lt+Ls,或非目标攻击下的Lc=Lnt+Ls;Ls为基于攻击成功对抗样本计算的损失值;
像素级约束损失值Lpix根据攻击扰动测量方式不同选择不同目标函数;
步骤4:重复步骤1到步骤3预定次数后,生成网络即可生成攻击成功率达到预定要求的通用扰动攻击被攻击模型。
2.根据权利要求1所述的基于生成对抗网络的通用扰动生成方法,其特征在于,步骤1的具体实现包括以下子步骤:
步骤1.1:获取任意图片样本数据集Xraw并进行数据扩充,随机选择其中部分样本进行翻转、0值填充生成新的图片加入数据集中,再将Xraw中的样本随机裁剪为深度学习模型输入大小,得到样本数为m的训练数据集X;
步骤1.2:使用卷积层、反卷积层构建通用扰动生成网络G,网络中上采样部分每一层的输入都为下采样的特征加上一层特征输出,网络参数为表1;
表1
步骤1.3:生成与训练数据集X相同像素大小的噪声图片数据集Z,噪声图片每一像素的数值为符合N(0,0.5)正态分布的随机数,将数据集输入生成网络,得到样本数为m的通用扰动选择噪声系数α,将通用扰动与图片样本得到对抗样本其结合公式如下:
x′=α×μ+x。
3.根据权利要求2所述的基于生成对抗网络的通用扰动生成方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:构建判别网络D,判别网络D将样本分为N×N块,预测每一块为真实样本的概率值,网络参数为表2;
表2
步骤2.2:将图片样本与对抗样本输入判别网络计算损失函数Ld;
其中,D(x(j))表示判别网络输出结果,G(z(j))表示生成网络输出结果;
步骤2.3:反向传播更新判别网络权重其中,表示ωd的梯度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010254686.2/1.html,转载请声明来源钻瓜专利网。