[发明专利]一种基于贝叶斯优化的对抗样本生成方法有效
申请号: | 201910414533.7 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110276377B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 刘林兴;冯建文 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F21/55 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于贝叶斯优化的对抗样本生成方法,现有的黑盒攻击方法需要通过大量地向模型进行查询来获取优化信息。本发明以原始图片作为输入,通过计算扰动图片与原始图片的结构相似度的梯度来确定待优化的位置;然后使用贝叶斯优化在选定的位置中进行采样优化,得到该位置上能使损失函数增加的扰动值;通过迭代的方式选择多个位置,并优化得到扰动值,直到改变被扰动图像的分类结果,或者达到最大迭代次数则停止。本发明能够有效降低查询向目标DNN模型查询的次数,且扰动像素点的数量较少。 | ||
搜索关键词: | 一种 基于 贝叶斯 优化 对抗 样本 生成 方法 | ||
【主权项】:
1.一种基于贝叶斯优化的对抗样本生成方法,其特征在于,该方法包括如下步骤:步骤一、获取源图像x的真实类别yc及其概率Mc以原始图像x作为以θ为参数的目标DNN分类器的输入,获得原始图像的概率输出向量M(x;θ);取概率输出向量中最大值对应的类别作为原始图像的类别预测yc,概率输出向量中最大值为Mc;步骤二、确定待优化的目标函数使用迭代的方法生成对抗样本,为了降低计算的复杂度,在每个迭代中仅扰动图像向量的某一维度;设扰动值为z,并将扰动值z赋值到Δx的对应维度;扰动值满足||z||<ε,以确保图像质量,ε为设定的阈值;将x+Δx输入到参数为θ的深层神经网络DNN分类器中,得到预测输出向量M(x+Δx;θ);令M(x+Δx;θ)中除yc类别外的最大概率值为Mt,其对应的类别为yt,目标函数定义为B(z)=log(Mc)‑log(Mt);优化的目标是B(z)≤0,从而改变目标DNN分类器对被扰动图像的分类结果;Δx是与x具有相同维度的全0扰动向量;步骤三、确定此次迭代中需要优化的坐标与通道在第T次迭代中,计算当前扰动图像x′=x+Δx与随机图像xG的结构相似度的梯度
选择其中最小梯度值对应的维度s作为需要的优化维度;xG是与x具有相同维度的从高斯分布中采样得到的随机向量;步骤四、对特定维度中使用贝叶斯优化1)使用高斯过程代理待优化的目标函数,使用EI策略作为采集函数;设定最大测试点次数为I,以及当前测试点数量i=0;首先随机选择几个扰动值进行测试,生成初始观测数据集D1:t,包含t个已观测数据点;2)根据已观测到的数据集D1:t得到的后验分布构造一个EI采集函数αt(z;D1:t):
其中,v*表示当前最优函数值,φ(·)为标准正态分布概率密度函数,μt(z)与σt(z)分别表示D1:t中数据点的均值与方差;3)通过最大化采集函数选择下一个评估点zt+1=maxz∈zαt(z;D1:t),将zt+1赋值到Δx的对应维度s,并评估此时的目标函数值B(zt+1),在zt+1处评估后将评估值加入观测数据集D;i+=1,若i≤I,转(2);4)输出已观测数据集中的最小函数值B(z)及其对应的扰动值z;步骤五:将步骤四得到的最佳扰动值z赋值到扰动向量Δx;若B(z)<0,则认为攻击成功,将被扰动图片x+Δx作为对抗样本输出,若B(z)≥0,则认为在此次迭代中攻击不成功,跳转到步骤三,在当前扰动向量Δx的基础上继续下一次迭代。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910414533.7/,转载请声明来源钻瓜专利网。